Open Models, Ready for Production

Run 591,867 Open Models on the Frontier Inference Cloud.

Featured models

LLM

nvidia

Nemotron-3-Embed-8B-BF16

Dedicated

LLM

nvidia

Nemotron-3-Embed-1B-BF16

Dedicated

LLM

nvidia

Nemotron-3-Embed-1B-NVFP4

Dedicated

LLM

zai-org

GLM-5.2

Model APIs

Dedicated

Multimodal

MiniMaxAI

MiniMax-M3

Dedicated

Multimodal

moonshotai

Kimi-K2.7-Code

Dedicated

LLM

zai-org

GLM-5.1

Model APIs

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Flash

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Pro

Dedicated

LLM

deepseek-ai

DeepSeek-V3.2

Model APIs

Dedicated

LLM

MiniMaxAI

MiniMax-M2.5

Model APIs

Dedicated

Multimodal

google

gemma-4-31B-it

Model APIs

Dedicated

All models

591,867 results found

Model Name

Input

Output

Type

tokyotech-llm

Llama-3.3-Swallow-70B-v0.4

Base

Deploy

huihui-ai

Qwen2.5-VL-3B-Instruct-abliterated

Quantized

Deploy

allenai

OLMoE-1B-7B-0125-Instruct

Fine-tuned

Deploy

PygmalionAI

Pygmalion-3-12B

Fine-tuned

Deploy

sarvamai

sarvam-1

Base

Deploy

ystemsrx

Qwen2-Boundless

Base

Deploy

google

gemma-2-9b

Base

Deploy

Gustavosta

MagicPrompt-Stable-Diffusion

Base

Deploy

DISLab

Ext2Gen-8B-R2

Fine-tuned

Deploy

huihui-ai

Qwen2.5-VL-7B-Instruct-abliterated

Fine-tuned

Deploy

huihui-ai

DeepSeek-R1-Distill-Qwen-14B-abliterated-v2

Fine-tuned

Deploy

AtlaAI

Selene-1-Mini-Llama-3.1-8B

Fine-tuned

Deploy

LGAI-EXAONE

EXAONE-3.5-7.8B-Instruct

Base

Deploy

HuggingFaceTB

SmolVLM-Instruct

Quantized

Deploy

Qwen

Qwen2.5-Coder-14B-Instruct

Fine-tuned

Deploy

openai-community

gpt2-large

Base

Deploy

jinaai

reader-lm-1.5b

Base

Deploy

google

gemma-2-27b-it

Fine-tuned

Deploy

sophosympatheia

Midnight-Miqu-70B-v1.5

Merged

Deploy

defog

sqlcoder-7b-2

Base

Deploy

openai

whisper-small

Base

Deploy

distilbert

distilgpt2

Base

Deploy

deepseek-ai

DeepSeek-R1-Zero

Base

Deploy

inflatebot

MN-12B-Mag-Mell-R1

Merged

Deploy

Qwen

Qwen2.5-1.5B

Base

Deploy

deepseek-ai

DeepSeek-Coder-V2-Instruct

Fine-tuned

Deploy

openai

whisper-large-v2

Base

Deploy

openai

whisper-tiny

Base

Deploy

ISTA-DASLab

gemma-3-27b-it-GPTQ-4b-128g

Quantized

Deploy

ds4sd

SmolDocling-256M-preview

Quantized

Deploy

huihui-ai

DeepSeek-R1-Distill-Qwen-32B-abliterated

Fine-tuned

Deploy

google

gemma-7b

Base

Deploy

LatitudeGames

Wayfarer-12B

Fine-tuned

Deploy

google

gemma-2-9b-it

Fine-tuned

Deploy

microsoft

Phi-3-mini-4k-instruct

Base

Deploy

JungZoona

T3Q-qwen2.5-14b-v1.0-e3

Fine-tuned

Deploy

Qwen

Qwen2.5-VL-72B-Instruct

Base

Deploy

Qwen

Qwen2.5-1.5B-Instruct

Fine-tuned

Deploy

google

gemma-3-4b-pt

Base

Deploy

Qwen

Qwen2-VL-7B-Instruct

Fine-tuned

Deploy

openbmb

MiniCPM-V-2_6

Base

Deploy

llava-hf

llava-1.5-7b-hf

Base

Deploy