ChimAI/legal-ai-chimai-35b API & Inference Endpoint

Mục đích sử dụng

Trợ lý pháp luật cho người dùng Việt Nam: tóm tắt văn bản, giải thích quy định, trả lời câu hỏi pháp lý.

Khuyến nghị mạnh: dùng kèm RAG (truy hồi văn bản gốc rồi đưa vào ngữ cảnh). Mô hình này được fine-tune để có văn phong pháp lý và nhận diện thương hiệu nhất quán, không dùng để ghi nhớ chính xác số điều/khoản.

Giới hạn quan trọng (đọc kỹ)

⚠️ Có thể bịa trích dẫn pháp luật (sai số điều/khoản, sai nội dung) nếu hỏi trực tiếp không có ngữ cảnh RAG. Đừng tin số điều luật do model tự đưa ra mà không kiểm chứng với văn bản gốc.
Đây là model suy luận: nên tắt thinking khi serve (enable_thinking=False) hoặc cắt phần trước </think>.
Khuyến nghị sinh với repetition_penalty≈1.15 để tránh lặp.
Thông tin chỉ mang tính tham khảo, KHÔNG thay thế tư vấn của luật sư có thẩm quyền.
Phần nhận diện thương hiệu là branding, không phải hàng rào bảo mật; ràng buộc cứng cần guardrail ở tầng hệ thống.

Cách dùng

python
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

mid = "chimai/legal-ai-chimai-35b"
tok = AutoTokenizer.from_pretrained(mid)
model = AutoModelForCausalLM.from_pretrained(mid, dtype=torch.bfloat16, device_map="auto")

msgs = [{"role": "user", "content": "Bạn là ai?"}]
inputs = tok.apply_chat_template(msgs, add_generation_prompt=True, enable_thinking=False,
                                 return_tensors="pt", return_dict=True).to(model.device)
out = model.generate(**inputs, max_new_tokens=256, repetition_penalty=1.15, no_repeat_ngram_size=4)
print(tok.decode(out[0][inputs["input_ids"].shape[1]:], skip_special_tokens=True))

Attribution

Mô hình này là sản phẩm dẫn xuất (derivative) của Qwen3.5-35B-A3B, phân phối theo Apache 2.0.

legal-ai-chimai-35b

Get help setting up a custom Dedicated Endpoints.

README

Mục đích sử dụng

Giới hạn quan trọng (đọc kỹ)

Cách dùng

Attribution

Explore FriendliAI today

legal-ai-chimai-35b