Open Models, Ready for Production

Run 590,512 Open Models on the Frontier Inference Cloud.

Featured models

LLM

zai-org

GLM-5.2

Model APIs

Dedicated

Multimodal

MiniMaxAI

MiniMax-M3

Dedicated

Multimodal

moonshotai

Kimi-K2.7-Code

Dedicated

LLM

zai-org

GLM-5.1

Model APIs

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Flash

Dedicated

LLM

deepseek-ai

DeepSeek-V4-Pro

Dedicated

LLM

deepseek-ai

DeepSeek-V3.2

Model APIs

Dedicated

LLM

MiniMaxAI

MiniMax-M2.5

Model APIs

Dedicated

Multimodal

google

gemma-4-31B-it

Model APIs

Dedicated

All models

590,512 results found

Model Name

Input

Output

Type

coder3101

gemma-4-31B-it-heretic-v2

Fine-tuned

Deploy

google

gemma-4-31B

Base

Deploy

Qwen

Qwen3.5-4B

Fine-tuned

Deploy

Qwen

Qwen3.5-0.8B

Fine-tuned

Deploy

google

medgemma-1.5-4b-it

Base

Deploy

NousResearch

Hermes-4.3-36B

Fine-tuned

Deploy

Qwen

Qwen3-Coder-30B-A3B-Instruct

Base

Deploy

Qwen

Qwen3-0.6B

Fine-tuned

Deploy

ProCreations

grug-35b

Fine-tuned

Deploy

nvidia

Nemotron-3-Embed-1B-BF16

Base

Deploy

nvidia

NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16

Base

Deploy

Qwen

WebWorld-8B

Fine-tuned

Deploy

DavidAU

Qwen3.5-9B-Claude-4.6-HighIQ-THINKING-HERETIC-UNCENSORED

Fine-tuned

Deploy

openbmb

MiniCPM-o-4_5

Base

Deploy

0xSero

MiniMax-M2.1-REAP-25

Quantized

Deploy

black-forest-labs

FLUX.1-Kontext-dev

Base

Deploy

google

gemma-3-4b-it

Fine-tuned

Deploy

meta-llama

Llama-3.3-70B-Instruct

Fine-tuned

Deploy

oyildirim

CyberStrike-OffSec-35B

Fine-tuned

Deploy

apodex

Apodex-1.0-mini

Fine-tuned

Deploy

ibm-granite

granite-4.1-8b

Base

Deploy

Qwen

Qwen3-8B

Fine-tuned

Deploy

meta-llama

Llama-3.1-8B

Base

Deploy

openai

whisper-large-v3-turbo

Fine-tuned

Deploy

meta-llama

Llama-3.2-1B

Base

Deploy

Qwen

Qwen2.5-VL-7B-Instruct

Base

Deploy

unsloth

GLM-4.7-Flash-NVFP4

Quantized

Deploy

nvidia

Nemotron-3-Embed-8B-BF16

Base

Deploy

drowzeys

DeepSeek-V4-Flash-DSpark-Abliterated-Uncensored

Quantized

Deploy

XiaomiMiMo

MiMo-V2.5

Base

Deploy

Soofi-Project

Soofi-S-Isar-Preview

Base

Deploy

deepreinforce-ai

Ornith-1.0-35B-FP8

Base

Deploy

deepreinforce-ai

Ornith-1.0-397B

Base

Deploy

Chunjiang-Intelligence

DeepSeek-v4-Fable

Adapter

Deploy

nvidia

NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Base

Deploy

nex-agi

Nex-N2-mini

Base

Deploy

Qwen

Qwen3.6-27B-FP8

Quantized

Deploy

moonshotai

Kimi-K2.6

Base

Deploy

RohitUltimate

Qwen3.5_VL_2B_12k

Fine-tuned

Deploy

google

gemma-4-26B-A4B

Base

Deploy

rednote-dots-ocr-community

dots.ocr-1.5

Base

Deploy

Kbenkhaled

Qwen3.5-27B-NVFP4

Quantized

Deploy