caiovicentino1

Nemotron-Cascade-2-30B-A3B-PolarQuant-Q5

Deploy Dedicated

Available on FriendliAI

Dedicated Endpoints

Run this model inference on single tenant GPU with unmatched speed and reliability at scale.

Model Details

Model Provider

caiovicentino1

Model Tree

Base

nvidia/Nemotron-Cascade-2-30B-A3B

Quantized

this model

Input Modalities

Text

Output Modalities

Text

Supported Functionality

Dedicated Endpoints

Explore FriendliAI today

Get started Talk to an engineer