⚡ Hit your SLA, cut costs. Download the Friendli Guide to Inference Performance Optimization ➜

Product

Model APIs Dedicated Endpoints Container Why FriendliAI

Solutions

Coding Agents Chatbots Semantic Search Visual Understanding Audio & Voice Analysis

Developers

Docs Blog Research

Company

About Us Partners News Careers Patents Brand Resources Trust Center Contact Us

HIPAA Compliance

AICPA SOC 2® Type II

SOC 2® Type II

Contact us:

contact@friendli.ai

FriendliAI Corp:

San Francisco, CA

Hub:

Seoul, Korea

SOC 2® Type II

Privacy Policy Service Level Agreement Terms of Service CA Notice

Copyright © 2026 FriendliAI Corp. All rights reserved

Models
Customers
Pricing

568,692 Models Available

Featured models

All models

20,384 results found

Model Name

Input

Output

Type

TeichAI

gemma-4-31B-it-Claude-Opus-Distill-v2

Fine-tuned

Deploy

huihui-ai

Huihui-gemma-4-26B-A4B-it-abliterated

Fine-tuned

Deploy

aifeifei798

Gemma-4-Queen-31B-it

Fine-tuned

Deploy

AEON-7

Gemma-4-26B-A4B-it-Uncensored-NVFP4

Quantized

Deploy

jiwon9703

Gemma4-26B-A4B-Korean-Opus-4.6-Distilled

Fine-tuned

Deploy

llmfan46

gemma-4-26B-A4B-it-uncensored-heretic

Fine-tuned

Deploy

jenerallee78

gemma-4-26B-A4B-it-ara-abliterated

Quantized

Deploy

TrevorJS

gemma-4-E2B-it-uncensored

Fine-tuned

Deploy

EganAI

gemma-4-31B-Claude-4.6-Opus-Reasoning-Distilled

Fine-tuned

Deploy

cyankiwi

gemma-4-31B-it-AWQ-8bit

Quantized

Deploy

cyankiwi

gemma-4-31B-it-AWQ-4bit

Quantized

Deploy

coder3101

gemma-4-31B-it-heretic

Fine-tuned

Deploy

DavidAU

Qwen3.5-21B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking

Fine-tuned

Deploy

caiovicentino1

Qwen3.5-9B-PolarQuant-Q5

Quantized

Deploy

llmfan46

Qwen3.5-9B-ultra-uncensored-heretic-v2

Fine-tuned

Deploy

huihui-ai

Huihui-Qwen3.5-4B-Claude-4.6-Opus-abliterated

Fine-tuned

Deploy

DavidAU

Qwen3.5-4B-Claude-4.6-OS-Auto-Variable-HERETIC-UNCENSORED-THINKING

Fine-tuned

Deploy

huihui-ai

Huihui-Qwen3.5-9B-abliterated

Fine-tuned

Deploy

Jackrong

Qwen3.5-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled

Base

Deploy

trohrbaugh

Qwen3.5-397B-A17B-heretic

Base

Deploy

llmfan46

Qwen3.5-35B-A3B-heretic-v2

Fine-tuned

Deploy

darkc0de

Qwen3.5-9B-heretic

Fine-tuned

Deploy

unsloth

Qwen3.5-4B

Fine-tuned

Deploy

Qwen

Qwen3.5-0.8B-Base

Base

Deploy

llmfan46

Qwen3.5-27B-heretic-v2

Fine-tuned

Deploy

huihui-ai

Huihui-Qwen3.5-35B-A3B-abliterated

Fine-tuned

Deploy

deepseek-ai

DeepSeek-OCR

Base

Deploy

prithivMLmods

Qwen3-VL-8B-Instruct-abliterated-v2.0

Fine-tuned

Deploy

thesby

Qwen3-VL-8B-NSFW-Caption-V4.5

Fine-tuned

Deploy

mlfoundations-cua-dev

Gelato-30B-A3B

Fine-tuned

Deploy

OpenGVLab

VideoChat-R1_5

Fine-tuned

Deploy

ibm-granite

granite-docling-258M-mlx

Fine-tuned

Deploy

OpenGVLab

InternVL3-78B

Fine-tuned

Deploy

Qwen

Qwen2.5-VL-32B-Instruct

Base

Deploy

bytedance-research

UI-TARS-7B-SFT

Base

Deploy

HuggingFaceTB

SmolVLM-256M-Instruct

Quantized

Deploy

google

paligemma-3b-mix-224

Base

Deploy

bytedance-research

UI-TARS-72B-DPO

Base

Deploy

microsoft

Phi-4-multimodal-instruct

Base

Deploy

allenai

Molmo-7B-D-0924

Fine-tuned

Deploy

Noemit

gemma-4-31B-it

Fine-tuned

Deploy

iamwales

gemma4-e2b-natip-qlora

Adapter

Deploy

Load more models