Run this model inference on single tenant GPU with unmatched speed and reliability at scale.
Get help setting up a custom Dedicated Endpoints.
Talk with our engineer to get a quote for reserved GPU instances with discounts.
README
License: apache-2.0Mục đích sử dụng
Trợ lý pháp luật cho người dùng Việt Nam: tóm tắt văn bản, giải thích quy định, trả lời câu hỏi pháp lý.
Khuyến nghị mạnh: dùng kèm RAG (truy hồi văn bản gốc rồi đưa vào ngữ cảnh). Mô hình này được fine-tune để có văn phong pháp lý và nhận diện thương hiệu nhất quán, không dùng để ghi nhớ chính xác số điều/khoản.
Giới hạn quan trọng (đọc kỹ)
- ⚠️ Có thể bịa trích dẫn pháp luật (sai số điều/khoản, sai nội dung) nếu hỏi trực tiếp không có ngữ cảnh RAG. Đừng tin số điều luật do model tự đưa ra mà không kiểm chứng với văn bản gốc.
- Đây là model suy luận: nên tắt thinking khi serve (
enable_thinking=False) hoặc cắt phần trước</think>. - Khuyến nghị sinh với
repetition_penalty≈1.15để tránh lặp. - Thông tin chỉ mang tính tham khảo, KHÔNG thay thế tư vấn của luật sư có thẩm quyền.
- Phần nhận diện thương hiệu là branding, không phải hàng rào bảo mật; ràng buộc cứng cần guardrail ở tầng hệ thống.
Cách dùng
python
from transformers import AutoTokenizer, AutoModelForCausalLMimport torchmid = "chimai/legal-ai-chimai-35b"tok = AutoTokenizer.from_pretrained(mid)model = AutoModelForCausalLM.from_pretrained(mid, dtype=torch.bfloat16, device_map="auto")msgs = [{"role": "user", "content": "Bạn là ai?"}]inputs = tok.apply_chat_template(msgs, add_generation_prompt=True, enable_thinking=False,return_tensors="pt", return_dict=True).to(model.device)out = model.generate(**inputs, max_new_tokens=256, repetition_penalty=1.15, no_repeat_ngram_size=4)print(tok.decode(out[0][inputs["input_ids"].shape[1]:], skip_special_tokens=True))
Attribution
Mô hình này là sản phẩm dẫn xuất (derivative) của Qwen3.5-35B-A3B, phân phối theo Apache 2.0.
Model provider
ChimAI
Model tree
Base
Qwen/Qwen3.5-35B-A3B
Fine-tuned
this model
Modalities
Input
Video, Text, Image
Output
Text
Pricing
Dedicated Endpoints
View detailsSupported Functionality
Model APIs
Dedicated Endpoints
Container
More information