Open Models, Ready for Production

nvidia

Nemotron-3-Embed-8B-BF16

Dedicated

nvidia

Nemotron-3-Embed-1B-BF16

Dedicated

nvidia

Nemotron-3-Embed-1B-NVFP4

Dedicated

zai-org

GLM-5.2

Model APIs

Dedicated

Multimodal

MiniMaxAI

MiniMax-M3

Dedicated

Multimodal

moonshotai

Kimi-K2.7-Code

Dedicated

zai-org

GLM-5.1

Model APIs

Dedicated

deepseek-ai

DeepSeek-V4-Flash

Dedicated

deepseek-ai

DeepSeek-V4-Pro

Dedicated

deepseek-ai

DeepSeek-V3.2

Model APIs

Dedicated

MiniMaxAI

MiniMax-M2.5

Model APIs

Dedicated

Multimodal

google

gemma-4-31B-it

Model APIs

Dedicated

All models

548,533 results found

Model Name

Input

Output

Type

nvidia

Orchestrator-8B

Deploy

microsoft

FastContext-1.0-4B-SFT

Deploy

moonshotai

Kimi-K2.7-Code

Deploy

zai-org

GLM-5.2

Deploy

zai-org

GLM-5.1

Deploy

zai-org

GLM-4.6

Deploy

black-forest-labs

FLUX.1-dev

Deploy

mistralai

Magistral-Small-2506

Deploy

moonshotai

Kimi-K2.6

Deploy

GnLOLot

MiniCPM5-1B-Claude-Opus-Fable5-Thinking

Deploy

skt

A.X-3.1

Deploy

mindlab-research

Macaron-V1-Venti

Deploy

Qwen

Qwen3-235B-A22B-Thinking-2507

Deploy

Qwen

Qwen3-235B-A22B-Instruct-2507

Deploy

google

gemma-4-26B-A4B-it

Deploy

0xSero

MiniMax-M2.1-REAP-50-W4A16

Deploy

meta-llama

Llama-3.1-8B-Instruct

Deploy

openbmb

MiniCPM5-1B

Deploy

black-forest-labs

FLUX.1-schnell

Deploy

microsoft

FastContext-1.0-4B-RL

Deploy

Jiunsong

SuperGLM-5.2-abliterated-NVFP4

Quantized

Deploy

Qwen

Qwen3-0.6B

Deploy

google

gemma-4-E4B-it

Deploy

openai

gpt-oss-120b

Deploy

Trelis

tiron

Deploy

mistralai

Devstral-Small-2505

Deploy

openai

whisper-large-v3

Deploy

zandenAI

GLM-5.2-FP8-Uncensored

Quantized

Deploy

ICONNAI

ICONN-e1

Deploy

Qwen

Qwen3-8B

Deploy

meta-llama

Meta-Llama-3-8B-Instruct

Deploy

openai

gpt-oss-20b

Deploy

zai-org

GLM-5.2-FP8

Deploy

numind

NuMarkdown-8B-Thinking

Deploy

GnLOLot

MiniCPM5-1B-Claude-Opus-Fable5-V2-Thinking

Deploy

sais-org

Polaris_Pro

Deploy

Qwen

Qwen3-VL-Embedding-2B

Deploy

Qwen

Qwen3-VL-8B-Instruct

Deploy

Qwen

Qwen3-32B

Deploy

meta-llama

Llama-4-Scout-17B-16E-Instruct

Deploy

deepseek-ai

DeepSeek-R1

Deploy

microsoft

MagenticBrain