Open Models, Ready for Production

Run 590,522 Open Models on the Frontier Inference Cloud.

Featured models

LLM

zai-org

GLM-5.2

Model APIs

Dedicated

Multimodal

MiniMaxAI

MiniMax-M3

Dedicated

Multimodal

moonshotai

Kimi-K2.7-Code

Dedicated

LLM

zai-org

GLM-5.1

Model APIs

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Flash

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Pro

Dedicated

LLM

deepseek-ai

DeepSeek-V3.2

Model APIs

Dedicated

LLM

MiniMaxAI

MiniMax-M2.5

Model APIs

Dedicated

Multimodal

google

gemma-4-31B-it

Model APIs

Dedicated

All models

590,522 results found

Model Name

Input

Output

Type

rednote-dots-ocr-community

dots.ocr-1.5

Base

Deploy

Kbenkhaled

Qwen3.5-27B-NVFP4

Quantized

Deploy

google

functiongemma-270m-it

Base

Deploy

Qwen

Qwen3-VL-8B-Instruct

Base

Deploy

dphn

Dolphin-Mistral-24B-Venice-Edition

Fine-tuned

Deploy

Qwen

Qwen3-14B

Fine-tuned

Deploy

google

paligemma-3b-pt-224

Base

Deploy

meta-llama

Llama-3.2-3B

Base

Deploy

mistralai

Mistral-7B-Instruct-v0.3

Fine-tuned

Deploy

Vortex5

G4-Moonlight-Dusk-26B-A4B

Merged

Deploy

Naphula

Slimaki-Tavern-24B-v1.3

Merged

Deploy

poolside

Laguna-M.1

Base

Deploy

lazarus19

Vibe-Coding-Instruct

Fine-tuned

Deploy

Lorbus

GLM-5.2-NVFP4

Quantized

Deploy

armand0e

Qwen3.6-27B-Fable-5-Overfitted

Fine-tuned

Deploy

tencent

Hy-MT2-1.8B

Base

Deploy

nvidia

Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16

Base

Deploy

wangzhang

Qwen3.6-27B-abliterated-v2

Fine-tuned

Deploy

CohereLabs

cohere-transcribe-03-2026

Base

Deploy

datalab-to

chandra-ocr-2

Base

Deploy

DreamFast

gemma-3-12b-it-heretic-v2

Quantized

Deploy

lightonai

LightOnOCR-2-1B

Base

Deploy

zai-org

GLM-4.7-Flash

Base

Deploy

0xSero

MiniMax-M2.1-REAP-50

Quantized

Deploy

mistralai

Devstral-Small-2-24B-Instruct-2512

Quantized

Deploy

aquif-ai

aquif-3.5-Nano-1B

Fine-tuned

Deploy

mistralai

Ministral-3-14B-Instruct-2512

Quantized

Deploy

Qwen

Qwen3-VL-4B-Instruct

Base

Deploy

AgentFlow

agentflow-planner-7b

Base

Deploy

cpatonn

Qwen3-30B-A3B-Thinking-2507-AWQ

Quantized

Deploy

sarvamai

sarvam-translate

Fine-tuned

Deploy

mistralai

Mistral-Small-3.1-24B-Instruct-2503

Fine-tuned

Deploy

meta-llama

Llama-4-Maverick-17B-128E-Instruct

Fine-tuned

Deploy

luvGPT

phi3-uncensored-chat

Base

Deploy

deepseek-ai

DeepSeek-R1-Distill-Qwen-1.5B

Base

Deploy

prism-ml

Bonsai-27B-AWQ-4bit

Base

Deploy

jarrelscy

GLM-5.2-NVFP4-AQLM-hybrid

Quantized

Deploy

xue-26

SAWM

Base

Deploy

yuxinlu1

gemma-4-12B-agentic-fable5-composer2.5-v2-3.5x-tau2

Fine-tuned

Deploy

AEON-7

Ornith-1.0-35B-AEON-Ultimate-Uncensored-BF16

Fine-tuned

Deploy

datalab-to

lift

Base

Deploy

empero-ai

Qwable-9B-Claude-Fable-5

Fine-tuned

Deploy