zero9tech
Qwen3.5-9B-Wikipedia-TR-CPT
Run this model inference on single tenant GPU with unmatched speed and reliability at scale.
Get help setting up a custom Dedicated Endpoints.
Talk with our engineer to get a quote for reserved GPU instances with discounts.
README
License: apache-2.0Eğitim Kurgusu
Bu modelde Türkçe düşünme adaptasyonu amacıyla wikimedia/wikipedia verisi ana kaynak olarak kullanılmıştır. Bu modelde Türkçe düşünme adaptasyonu için Continued PreTraining (CPT) uygulanmıştır. Adaptasyon kurgusunda veri bileşiminin yaklaşık %99'u wikimedia/wikipedia tabanlıdır.
Not: Yüzde oranı, modelin tüm tarihsel ön eğitimi değil; CPT aşamasındaki adaptasyon veri karışımını ifade eder.
Teknik Eğitim Ayrıntıları: QLoRA Tabanlı CPT
Bu model, tam-parametreli yeniden ön eğitim yerine QLoRA tabanlı Continued PreTraining (CPT) yaklaşımıyla adapte edilmiştir. Eğitim sürecinde temel model 4-bit olarak yüklenmiş, güncelleme işlemi LoRA adaptörleri üzerinden yapılmıştır. Bu nedenle model kartındaki CPT ifadesi, tam-parametre CPT değil, parametre-verimli QLoRA-CPT adaptasyonu olarak okunmalıdır.
QLoRA yapılandırmasında LoRA katmanları aşağıdaki modüllere uygulanmıştır:
q_proj,k_proj,v_proj,o_projgate_proj,up_proj,down_projembed_tokens,lm_head
Kullanılan başlıca LoRA ayarları:
r = 128lora_alpha = 128use_rslora = True- 4-bit model yükleme
UnslothTrainerile CPT eğitimidataset_text_field = "prompt"
Eğitim verisi, Türkçe Wikipedia içeriklerinden başlık ve makale gövdesi birleştirilerek hazırlanmıştır. Her örnek aşağıdaki metin formatına dönüştürülmüş ve örnek sonuna EOS_TOKEN eklenmiştir:
text
Vikipedi Makalesi### Başlık: {title}### Makale:{text}<EOS>
Bu kurgu, modele Türkçe ansiklopedik metin dağılımı üzerinde ek dilsel uyum kazandırmayı hedefler. Çalışmanın teknik tanımı bu nedenle Wikipedia tabanlı Türkçe QLoRA-CPT adaptasyonu şeklindedir.
Veri Kaynağı
wikimedia/wikipedia(Türkçe içerik odaklı)
Model Amacı
- Türkçe bağlamda daha tutarlı akıl yürütme
- Bilgi yoğun sorularda daha düzenli açıklama
- Türkçe teknik/analitik cevaplarda daha iyi akış
Önemli Not
- Model, eğitim verisindeki dağılıma bağlı önyargılar taşıyabilir.
- Kritik alanlarda (hukuk, sağlık, finans vb.) insan uzman kontrolü önerilir.
Lisans
Bu model Apache-2.0 lisansı ile sunulmuştur.
Copyright
Copyright (c) Zero9 Tech
Model provider
zero9tech
Model tree
Base
this model
Modalities
Input
Video, Text, Image
Output
Text
Pricing
Dedicated Endpoints
View detailsSupported Functionality
Model APIs
Dedicated Endpoints
Container
More information