Dedicated Endpoints

Run this model inference on single tenant GPU with unmatched speed and reliability at scale.

Learn more
Container

Run this model inference with full control and performance in your environment.

Learn more

Get help setting up a custom Dedicated Endpoints.

Talk with our engineer to get a quote for reserved GPU instances with discounts.

README

Base Model

unsloth/Qwen2.5-7B-Instruct-bnb-4bit

Bu repo tam model değil, yalnızca adapter dosyalarını içerir. Kullanım sırasında base model yüklenir ve bu adapter üzerine takılır.

Görev

Ham lojistik mesajından aşağıdaki JSON şemasını üretir:

json

{
"siparis_sayisi": 1,
"siparisler": [
{
"nereden": "Mersin",
"nereye": "Batman",
"yuk_tipi": "YÜKÜSTÜ",
"arac_tipi": "1360",
"kasa_tipi": "AÇIK"
}
]
}

Eğitim Bilgisi

  • Yöntem: QLoRA / LoRA
  • LoRA rank: 32
  • LoRA alpha: 64
  • Epoch: 3
  • Learning rate: 1e-4
  • Max sequence length: 2048

Test Sonucu

Test seti: 150 mesaj, 918 gold sipariş objesi.

MetrikSkor
JSON parse success99.33%
Schema valid rate99.33%
Sipariş sayısı consistency86.67%
Order precision97.88%
Order recall95.64%
Order F196.75%
Strict field micro F190.36%
Relaxed field micro F191.48%
Strict exact order match73.20%
Relaxed exact order match77.02%

Kullanım Notu

Çıktılar uygulama tarafında validator ile kontrol edilmelidir. Özellikle JSON parse, siparis_sayisi = len(siparisler) ve izinli değer seti kontrolleri önerilir.

Model provider

AlBarann

Model tree

Base

unsloth/Qwen2.5-7B-Instruct-bnb-4bit

Adapter

this model

Modalities

Input

Text

Output

Text

Pricing

Dedicated Endpoints

View details

Supported Functionality

Model APIs

Dedicated Endpoints

Container

More information

Explore FriendliAI today