⚡ Hit your SLA, cut costs. Download the Friendli Guide to Inference Performance Optimization ➜

Product

Model APIs Dedicated Endpoints Container Why FriendliAI

Solutions

Coding Agents Chatbots Semantic Search Visual Understanding Audio & Voice Analysis

Developers

Docs Blog Research

Company

About Us Partners News Careers Patents Brand Resources Trust Center Contact Us

HIPAA Compliance

AICPA SOC 2® Type II

SOC 2® Type II

Contact us:

contact@friendli.ai

FriendliAI Corp:

San Francisco, CA

Hub:

Seoul, Korea

SOC 2® Type II

Privacy Policy Service Level Agreement Terms of Service CA Notice

Copyright © 2026 FriendliAI Corp. All rights reserved

Models
Customers
Pricing

574,336 Models Available

Featured models

All models

531,333 results found

Model Name

Input

Output

Type

dphn

Dolphin3.0-R1-Mistral-24B

Fine-tuned

Deploy

Zaynoid

qwen2.5-7b-v1

Base

Deploy

Delta-Vector

Rei-24B-KTO

Fine-tuned

Deploy

Fentible

Cthulu-24B-v1

Merged

Deploy

moonshotai

Kimi-K2-Instruct

Base

Deploy

gokaygokay

Pencil-Drawing-Kontext-Dev-LoRA

Adapter

Deploy

nvidia

Riva-Translate-4B-Instruct

Fine-tuned

Deploy

ilkerzgi

embroidery-patch-kontext-dev-lora

Adapter

Deploy

CodCodingCode

deepseek-clinical-finetuned

Fine-tuned

Deploy

AdaptLLM

biomed-Qwen2.5-VL-3B-Instruct

Fine-tuned

Deploy

Kazame07

selflogic-tpu

Base

Deploy

Kazame07

selflogic-16

Base

Deploy

Kazame07

selflogic-core

Base

Deploy

Kontext-Style

Ghibli_lora

Adapter

Deploy

ilkerzgi

metallic-objects-kontext-dev-lora

Adapter

Deploy

facebook

Meta-SecAlign-8B

Adapter

Deploy

tngtech

DeepSeek-TNG-R1T2-Chimera

Merged

Deploy

bghira

LibreFLUX.1-Edit

Adapter

Deploy

kingabzpro

whisper-large-v3-turbo-urdu

Fine-tuned

Deploy

Goekdeniz-Guelmez

Gabliterated-Qwen3-0.6B

Fine-tuned

Deploy

Yuqian-Fu

SRFT

Fine-tuned

Deploy

sophosympatheia

Strawberrylemonade-70B-v1.2

Merged

Deploy

zerofata

MS3.2-PaintedFantasy-24B

Fine-tuned

Deploy

ai-sage

GigaChat-20B-A3B-instruct

Fine-tuned

Deploy

joshbarua

Qwen2.5-7B-base-japanese-bespoke-stratos-full-sft

Base

Deploy

bond005

whisper-podlodka-turbo

Fine-tuned

Deploy

huihui-ai

Huihui-Qwen3-4B-abliterated-v2

Fine-tuned

Deploy

Spestly

Ares-4B

Fine-tuned

Deploy

sizzlebop

crystal-think-v1.0

Adapter

Deploy

huihui-ai

Huihui-Qwen3-14B-abliterated-v2

Fine-tuned

Deploy

Rustamshry

NasimiLM

Base

Deploy

Qwen

Qwen3-235B-A22B-MLX-8bit

Base

Deploy

Qwen

Qwen3-235B-A22B-MLX-4bit

Base

Deploy

Qwen

Qwen3-30B-A3B-MLX-4bit

Base

Deploy

Qwen

Qwen3-32B-MLX-8bit

Base

Deploy

Qwen

Qwen3-8B-MLX-8bit

Base

Deploy

Qwen

Qwen3-32B-MLX-4bit

Base

Deploy

Qwen

Qwen3-30B-A3B-MLX-8bit

Base

Deploy

Qwen

Qwen3-32B-MLX-bf16

Base

Deploy

Qwen

Qwen3-1.7B-MLX-4bit

Quantized

Deploy

Qwen

Qwen3-14B-MLX-8bit

Quantized

Deploy

Qwen

Qwen3-1.7B-MLX-bf16

Fine-tuned

Deploy

Load more models