Open Models, Ready for Production

Run 590,534 Open Models on the Frontier Inference Cloud.

Featured models

LLM

zai-org

GLM-5.2

Model APIs

Dedicated

Multimodal

MiniMaxAI

MiniMax-M3

Dedicated

Multimodal

moonshotai

Kimi-K2.7-Code

Dedicated

LLM

zai-org

GLM-5.1

Model APIs

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Flash

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Pro

Dedicated

LLM

deepseek-ai

DeepSeek-V3.2

Model APIs

Dedicated

LLM

MiniMaxAI

MiniMax-M2.5

Model APIs

Dedicated

Multimodal

google

gemma-4-31B-it

Model APIs

Dedicated

All models

590,534 results found

Model Name

Input

Output

Type

datalab-to

lift

Base

Deploy

empero-ai

Qwable-9B-Claude-Fable-5

Fine-tuned

Deploy

HiDream-ai

HiDream-O1-Image

Base

Deploy

ibm-granite

granite-4.1-3b

Base

Deploy

llmfan46

gemma-4-31B-it-uncensored-heretic

Fine-tuned

Deploy

caiovicentino1

Nemotron-Cascade-2-30B-A3B-PolarQuant-Q5

Quantized

Deploy

ZERO-POINT-INTELLIGENCE-LTD

UNSTABLE-NOT-FOR-DOWNLOAD-UNFITTING-WEAK-NEEDS-RETRAIN

Quantized

Deploy

nvidia

Nemotron-Cascade-2-30B-A3B

Base

Deploy

wangzhang

Qwen3.5-122B-A10B-abliterated-v1

Fine-tuned

Deploy

llmfan46

Qwen3.5-9B-ultra-heretic

Fine-tuned

Deploy

Qwen

Qwen3.5-35B-A3B

Fine-tuned

Deploy

maya-research

maya-1-voice

Base

Deploy

Qwen

Qwen3-VL-2B-Instruct

Base

Deploy

ibm-granite

granite-docling-258M

Base

Deploy

cpatonn

Qwen3-30B-A3B-Instruct-2507-AWQ

Quantized

Deploy

Qwen

Qwen3-Reranker-0.6B

Fine-tuned

Deploy

google

medgemma-4b-it

Fine-tuned

Deploy

google

gemma-3-12b-it-qat-q4_0-unquantized

Fine-tuned

Deploy

enhanceaiteam

Flux-uncensored

Adapter

Deploy

openai-community

gpt2

Base

Deploy

google

gemma-2-2b-it

Fine-tuned

Deploy

microsoft

Phi-4-mini-instruct

Base

Deploy

Qwen

Qwen2.5-Coder-32B-Instruct

Fine-tuned

Deploy

Alibaba-DAMO-Academy

RynnBrain1.1-122B-A10B

Fine-tuned

Deploy

migtissera

Tess-4-27B-NVFP4

Quantized

Deploy

MaliosDark

Nexus-Erebus-50M

Base

Deploy

XiaomiMiMo

MiMo-V2.5-Pro

Base

Deploy

sakamakismile

ThinkingCap-Qwen3.6-27B-NVFP4

Quantized

Deploy

Bahushruth

GLM-5.2-FP8-abliterated

Quantized

Deploy

amalia-llm

AMALIA-9B-0626-SFT

Base

Deploy

InternScience

Agents-A1-FP8

Quantized

Deploy

armand0e

Qwen3.6-35B-A3B-Fable-5-Distill

Fine-tuned

Deploy

huihui-ai

Huihui-Qwen-AgentWorld-35B-A3B-abliterated

Fine-tuned

Deploy

Qwen

Qwen3-ASR-1.7B-hf

Base

Deploy

deepreinforce-ai

Ornith-1.0-397B-FP8

Base

Deploy

GestaltLabs

Ornstein-3.5-9B-V2-FableKimi-Reasoning

Fine-tuned

Deploy

Naphula

Goetia-26B-A4B-v1.3-Absolute-Heretic-ARA

Merged

Deploy

lordx64

Qwable-v1

Fine-tuned

Deploy

openbmb

MiniCPM5-1B-Base

Base

Deploy

OpenOneRec

OneReason-0.8B-pretrain

Base

Deploy

Qwen

Qwen-Image-Bench

Fine-tuned

Deploy

HiDream-ai

HiDream-O1-Image-Dev-2604

Base

Deploy