Run this model inference on single tenant GPU with unmatched speed and reliability at scale.
Run this model inference with full control and performance in your environment.
Get help setting up a custom Dedicated Endpoints.
Talk with our engineer to get a quote for reserved GPU instances with discounts.
README
Base Model
unsloth/Qwen2.5-7B-Instruct-bnb-4bit
Bu repo tam model değil, yalnızca adapter dosyalarını içerir. Kullanım sırasında base model yüklenir ve bu adapter üzerine takılır.
Görev
Ham lojistik mesajından aşağıdaki JSON şemasını üretir:
json
{"siparis_sayisi": 1,"siparisler": [{"nereden": "Mersin","nereye": "Batman","yuk_tipi": "YÜKÜSTÜ","arac_tipi": "1360","kasa_tipi": "AÇIK"}]}
Eğitim Bilgisi
- Yöntem: QLoRA / LoRA
- LoRA rank: 32
- LoRA alpha: 64
- Epoch: 3
- Learning rate: 1e-4
- Max sequence length: 2048
Test Sonucu
Test seti: 150 mesaj, 918 gold sipariş objesi.
| Metrik | Skor |
|---|---|
| JSON parse success | 99.33% |
| Schema valid rate | 99.33% |
| Sipariş sayısı consistency | 86.67% |
| Order precision | 97.88% |
| Order recall | 95.64% |
| Order F1 | 96.75% |
| Strict field micro F1 | 90.36% |
| Relaxed field micro F1 | 91.48% |
| Strict exact order match | 73.20% |
| Relaxed exact order match | 77.02% |
Kullanım Notu
Çıktılar uygulama tarafında validator ile kontrol edilmelidir. Özellikle JSON parse, siparis_sayisi = len(siparisler) ve izinli değer seti kontrolleri önerilir.
Model provider
AlBarann
Model tree
Base
unsloth/Qwen2.5-7B-Instruct-bnb-4bit
Adapter
this model
Modalities
Input
Text
Output
Text
Pricing
Dedicated Endpoints
View detailsSupported Functionality
Model APIs
Dedicated Endpoints
Container
More information