Open Models, Ready for Production

Run 592,085 Open Models on the Frontier Inference Cloud.

Featured models

LLM

nvidia

Nemotron-3-Embed-8B-BF16

Dedicated

LLM

nvidia

Nemotron-3-Embed-1B-BF16

Dedicated

LLM

nvidia

Nemotron-3-Embed-1B-NVFP4

Dedicated

LLM

zai-org

GLM-5.2

Model APIs

Dedicated

Multimodal

MiniMaxAI

MiniMax-M3

Dedicated

Multimodal

moonshotai

Kimi-K2.7-Code

Dedicated

LLM

zai-org

GLM-5.1

Model APIs

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Flash

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Pro

Dedicated

LLM

deepseek-ai

DeepSeek-V3.2

Model APIs

Dedicated

LLM

MiniMaxAI

MiniMax-M2.5

Model APIs

Dedicated

Multimodal

google

gemma-4-31B-it

Model APIs

Dedicated

All models

592,085 results found

Model Name

Input

Output

Type

nvidia

Orchestrator-8B

Fine-tuned

Deploy

bottlecapai

ThinkingCap-Qwen3.6-27B

Fine-tuned

Deploy

ATH-MaaS

OvisOCR2

Fine-tuned

Deploy

GnLOLot

MiniCPM5-1B-Claude-Opus-Fable5-Thinking

Fine-tuned

Deploy

microsoft

FastContext-1.0-4B-SFT

Fine-tuned

Deploy

InternScience

Agents-A1

Base

Deploy

zai-org

GLM-5.2

Base

Deploy

zai-org

GLM-5.1

Base

Deploy

google

gemma-4-31B-it

Fine-tuned

Deploy

zai-org

GLM-5

Base

Deploy

moonshotai

Kimi-K2.7-Code

Base

Deploy

empero-ai

Qwythos-9B-Claude-Mythos-5-1M

Fine-tuned

Deploy

openbmb

MiniCPM5-1B

Base

Deploy

zai-org

GLM-4.6

Base

Deploy

empero-ai

Qwythos-9B-v2

Fine-tuned

Deploy

nvidia

Nemotron-3-Embed-1B-NVFP4

Quantized

Deploy

Jiunsong

SuperGLM-5.2-abliterated-NVFP4

Fine-tuned

Deploy

unsloth

Qwen3.6-27B-NVFP4

Quantized

Deploy

black-forest-labs

FLUX.1-dev

Base

Deploy

mistralai

Magistral-Small-2506

Fine-tuned

Deploy

Qwen

Qwen3.6-35B-A3B

Base

Deploy

SupraLabs

Supra-Router-51M

Fine-tuned

Deploy

skt

A.X-3.1

Base

Deploy

migtissera

Tess-4-27B

Fine-tuned

Deploy

deepreinforce-ai

Ornith-1.0-9B

Base

Deploy

Qwen

Qwen3.6-27B

Base

Deploy

deepreinforce-ai

Ornith-1.0-35B

Base

Deploy

deepseek-ai

DeepSeek-V4-Pro

Base

Deploy

deepseek-ai

DeepSeek-V4-Flash

Base

Deploy

Qwen

Qwen3-235B-A22B-Thinking-2507

Base

Deploy

Qwen

Qwen3-235B-A22B-Instruct-2507

Base

Deploy

t-tech

T-Search

Fine-tuned

Deploy

THUDM

GLM-4.1V-9B-Thinking

Fine-tuned

Deploy

GnLOLot

MiniCPM5-1B-Claude-Opus-Fable5-V2-Thinking

Fine-tuned

Deploy

DJLougen

Qwable-5-27B-Coder

Fine-tuned

Deploy

0xSero

MiniMax-M2.1-REAP-50-W4A16

Base

Deploy

InternScience

Agents-A1-4B

Base

Deploy

unsloth

Qwen3.6-35B-A3B-NVFP4

Quantized

Deploy

meta-llama

Llama-3.1-8B-Instruct

Fine-tuned

Deploy

Qwen

Qwen-AgentWorld-35B-A3B

Fine-tuned

Deploy

unsloth

Qwen3.6-35B-A3B-NVFP4-Fast

Quantized

Deploy

openai

gpt-oss-120b

Base

Deploy