DavidBShan

pyrite-pay-support-grpo70-qwen3.6-35b-a3b-lora

README

LoRA rank-64 adapter on Qwen/Qwen3.6-35B-A3B, trained with Freesolo GRPO on the Pyrite Pay support-ticket environment. Checkpoint grpo_000070.

Eval (final_eval, N=80, same harness as Haiku 4.5 baseline):

Available on FriendliAI

Dedicated Endpoints

Run this model inference on single tenant GPU with unmatched speed and reliability at scale.

Model Details

Model Provider

DavidBShan

Model Tree

Base

Qwen/Qwen3.6-35B-A3B

Adapter

this model

Input Modalities

Text

Image

Video

Output Modalities

Text

Supported Functionality

Dedicated Endpoints