Open Models, Ready for Production

Run 593,174 Open Models on the Frontier Inference Cloud.

Featured models

LLM

nvidia

Nemotron-3-Embed-8B-BF16

Dedicated

LLM

nvidia

Nemotron-3-Embed-1B-BF16

Dedicated

LLM

nvidia

Nemotron-3-Embed-1B-NVFP4

Dedicated

LLM

zai-org

GLM-5.2

Model APIs

Dedicated

Multimodal

MiniMaxAI

MiniMax-M3

Dedicated

Multimodal

moonshotai

Kimi-K2.7-Code

Dedicated

LLM

zai-org

GLM-5.1

Model APIs

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Flash

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Pro

Dedicated

LLM

deepseek-ai

DeepSeek-V3.2

Model APIs

Dedicated

LLM

MiniMaxAI

MiniMax-M2.5

Model APIs

Dedicated

Multimodal

google

gemma-4-31B-it

Model APIs

Dedicated

All models

593,174 results found

Model Name

Input

Output

Type

luca0621

appgen-qwen25-sft-recovery-frozen-lr5e7-1ep-v2

Base

Deploy

trishteehee

tinyllama-dpo

Base

Deploy

rita-cohere

iolai-tiny-aya-global-fmtpick-k3

Base

Deploy

luca0621

appgen-qwen3-sft-recovery-frozen-lr5e7-1ep-v2

Base

Deploy

nightmedia

Qwen3.5-9B-Holodeck-Tess-Bradbury-Orwell-q8-hi-mlx

Merged

Deploy

o-taco

qwen3vl-aokvqa

Adapter

Deploy

diegogs1451

qwen2.5-7B-Instruct-dUO-finetuned-20260720-3epochs

Adapter

Deploy

gradients-io-tournaments

tournament-tourn_8e2368772007113a_20260720-8e204e7e-50c3-4ae1-82b3-8798711e1843-5EeLcV3L

Adapter

Deploy

RexTRO111

InstructPythia-410M-LoRA-v1

Adapter

Deploy

ranwakhaled

nilechat-3b-ideal-noquant

Base

Deploy

nilgeoutim

RLCR-0.005smCE-hotpot-seed42

Fine-tuned

Deploy

Jazhyc

aletheias-phoenix-v3-incorrectness-r1

Adapter

Deploy

kmseong

llama2_7b-chat-gsm8k-safelora-thr0.35-r16-lr2e-4

Base

Deploy

alyaashyifa

llama-3.2-3b-alpaca-gpt4-id

Fine-tuned

Deploy

berkcangumusisik

voleykoc-qwen3-4b-lora

Adapter

Deploy

DeependraVerma

legal-slm-125m-sft

Fine-tuned

Deploy

Kerassy

Qwen3.5-9b-Medical-Reasoning-r1

Fine-tuned

Deploy

Kaito009-837

GLM-5.2

Base

Deploy

dvjuditha

Llama-3.2-3B-Indonesian-Alpaca

Fine-tuned

Deploy

sascha-frank-ai-research

tsft-rag-qwen2.5-14b-instruct

Fine-tuned

Deploy

Rohitkushwaha79

gemma-3-270m-claims-json

Fine-tuned

Deploy

bluecolor777

echoctx

Base

Deploy

originalTimi

Hypa-Orpheus-Step-latest-16bit

Fine-tuned

Deploy

cogni-x

MOYO-ResponseModel

Adapter

Deploy

kmseong

llama2_7b-chat-gsm8k-salora-r16-lr1e-4

Base

Deploy

RockToken

qwen3_30b_a3b_to_4b_onpolicy_5k_src35k-40k_cont2

Fine-tuned

Deploy

sascha-frank-ai-research

tsft-rag-qwen2.5-7b-instruct

Fine-tuned

Deploy

xcyuan

HAG-Qwen2.5-VL-7B-RU

Fine-tuned

Deploy

sascha-frank-ai-research

tsft-rag-qwen2.5-1.5b-instruct

Fine-tuned

Deploy

zhanxing

afm-qwen3-8b-sft-fiannce-music-movie

Fine-tuned

Deploy

FormlessAI

Qwen2.5-3B-Instruct-Translation-Unsloth

Base

Deploy

ishikauniphore

student_Original_nemotron_llama8bins

Base

Deploy

antonyMox

Qwen3.6-27B-AutoRound-INT4-wide-MTP

Quantized

Deploy

ranwakhaled

gemma-3-4b-it-ideal-noquant

Base

Deploy

Jazhyc

aletheias-phoenix-v3-resolved-intent-r1

Adapter

Deploy

gradients-io-tournaments

augmented-5bb983694b68f45e

Base

Deploy

bentoso

qwen2.5-3b-basic-legal-chatbot-sft

Base

Deploy

bentoso

qwen2.5-3b-skilled-legal-chatbot-sft

Base

Deploy

uzumix

SonyDIGICAM_flux1d

Adapter

Deploy

DeLabs

axeron-forge-8fefbd7b

Fine-tuned

Deploy

luca0621

appgen-qwen3-sft-g800-full-visual-lr5e7-1ep-v2

Base

Deploy

rylyshkvar

crubin-base

Base

Deploy