Open Models, Ready for Production

Run 591,071 Open Models on the Frontier Inference Cloud.

Featured models

LLM

zai-org

GLM-5.2

Model APIs

Dedicated

Multimodal

MiniMaxAI

MiniMax-M3

Dedicated

Multimodal

moonshotai

Kimi-K2.7-Code

Dedicated

LLM

zai-org

GLM-5.1

Model APIs

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Flash

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Pro

Dedicated

LLM

deepseek-ai

DeepSeek-V3.2

Model APIs

Dedicated

LLM

MiniMaxAI

MiniMax-M2.5

Model APIs

Dedicated

Multimodal

google

gemma-4-31B-it

Model APIs

Dedicated

All models

591,071 results found

Model Name

Input

Output

Type

abaryan

CyberXP_Agent_Llama_3.2_1B

Fine-tuned

Deploy

DreadPoor

Famino-TEST

Merged

Deploy

ibm-granite

granite-4.0-h-tiny

Base

Deploy

OfficerChul

Qwen2.5-VL-7B-Instruct-Android-Control

Fine-tuned

Deploy

Guilherme34

Lumina-mindcraft

Fine-tuned

Deploy

ServiceNow-AI

Apriel-1.5-15b-Thinker

Base

Deploy

qingy2024

WEBGEN-Devstral-24B

Fine-tuned

Deploy

deepseek-ai

DeepSeek-V3.2-Exp

Fine-tuned

Deploy

OfficerChul

InfiGUI-G1-3B-Android-Control

Fine-tuned

Deploy

Manoe

ATSFriendly_resume_bioblurb

Fine-tuned

Deploy

Guilherme34

internal-poke-70b-tool-call-improving-vtest

Fine-tuned

Deploy

MOHAMMED7M7

AI_Doctor_V1

Base

Deploy

OpenGVLab

InternVL3_5-4B-Flash

Fine-tuned

Deploy

ahmedshahriar

GhostWriterLlama-3.2-1B-DPO

Fine-tuned

Deploy

Loom-Labs

Daedalus-1-2B

Fine-tuned

Deploy

Qwen

Qwen3Guard-Gen-8B

Fine-tuned

Deploy

Qwen

Qwen3Guard-Gen-0.6B

Fine-tuned

Deploy

vanta-research

apollo-v1-7b

Adapter

Deploy

aibhavesh27

gita-guide-mistral-7b-merged

Base

Deploy

saysualp

send-money-qwen-25-7b

Fine-tuned

Deploy

Alibaba-NLP

Tongyi-DeepResearch-30B-A3B

Base

Deploy

NousResearch

K3-HF-BF16

Base

Deploy

DreadPoor

Anedonia-TEST

Merged

Deploy

HectorHe

Qwen1.5-MOE-aux-free-sft-math7k-5e-5-gamma-with-aux

Fine-tuned

Deploy

HectorHe

Qwen1.5-MOE-aux-free-sft-math7k-1e-1-gamma

Fine-tuned

Deploy

HectorHe

Qwen1.5-MOE-aux-free-sft-math7k-remove-aux-only

Fine-tuned

Deploy

HectorHe

Qwen1.5-MOE-aux-free-sft-continue-math7k-1e-4-gamma

Fine-tuned

Deploy

HectorHe

Qwen1.5-MOE-aux-free-sft-math7k-1e-5-gamma

Fine-tuned

Deploy

cpatonn

Qwen3-Next-80B-A3B-Instruct-AWQ-4bit

Quantized

Deploy

vrashad

gemma-3-4b-medical-azerbaijani

Adapter

Deploy

inference-net

Schematron-3B

Fine-tuned

Deploy

MWirelabs

neodac

Fine-tuned

Deploy

unsloth

ERNIE-4.5-21B-A3B-Thinking

Fine-tuned

Deploy

LLM360

K2-Think

Fine-tuned

Deploy

aquif-ai

aquif-3.5-A0.6B-Preview

Base

Deploy

pierstab71

gpt-oss-120b-mlx-6Bit

Quantized

Deploy

fluently

FluentlyQwen3-Coder-1.7B

Fine-tuned

Deploy

Fentible

Eldrinox-24B-v1

Merged

Deploy

jinaai

jina-code-embeddings-0.5b

Fine-tuned

Deploy

jinaai

jina-code-embeddings-1.5b

Fine-tuned

Deploy

NousResearch

Hermes-4-14B

Fine-tuned

Deploy

BrainWave-ML

ThoughtSwitch-V1-1.7b-Instruct

Base

Deploy