Skip to main content

Running real inference at scale? Apply for our limited $10K credit program — Find out more

Friendli Docs home page

Dashboard
Dashboard

Friendli Suite Guide

Website
Blog

Get Started

Overview
Supported Models
OpenAI Compatibility
Data Privacy & Security

Capabilities

Tool Calling
Structured Outputs
Reasoning
Multi‑modality

Friendli Dedicated Endpoints

Introduction
QuickStart
Plans & Pricing
Endpoints
Autoscaling
Online Quantization
Speculative Decoding
Multi-LoRA Serving
Versioning
Dataset
Beta
FAQs

Friendli Serverless Endpoints

Introduction
QuickStart
Plans & Pricing
Integrations
Tool Assisted API
Beta

Friendli Container

Introduction
QuickStart
Running Friendli Container
CUDA Compatibility
Multi-LoRA Serving
Quantization
MoE Models Serving
Optimizing Inference with Policy Search
SageMaker Integration
AWS EKS Add-On
Inference with gRPC
Monitoring

404

Page Not Found

We couldn't find the page. Maybe you were looking for one of these pages below?

Dedicated list endpoints Dedicated get endpoint status Introducing Friendli Dedicated Endpoints

⌘I