Dedicated Endpoints

Run this model inference on single tenant GPU with unmatched speed and reliability at scale.

Learn more

Get help setting up a custom Dedicated Endpoints.

Talk with our engineer to get a quote for reserved GPU instances with discounts.

README

License: apache-2.0

Mục đích sử dụng

Trợ lý pháp luật cho người dùng Việt Nam: tóm tắt văn bản, giải thích quy định, trả lời câu hỏi pháp lý.

Khuyến nghị mạnh: dùng kèm RAG (truy hồi văn bản gốc rồi đưa vào ngữ cảnh). Mô hình này được fine-tune để có văn phong pháp lý và nhận diện thương hiệu nhất quán, không dùng để ghi nhớ chính xác số điều/khoản.

Giới hạn quan trọng (đọc kỹ)

  • ⚠️ Có thể bịa trích dẫn pháp luật (sai số điều/khoản, sai nội dung) nếu hỏi trực tiếp không có ngữ cảnh RAG. Đừng tin số điều luật do model tự đưa ra mà không kiểm chứng với văn bản gốc.
  • Đây là model suy luận: nên tắt thinking khi serve (enable_thinking=False) hoặc cắt phần trước </think>.
  • Khuyến nghị sinh với repetition_penalty≈1.15 để tránh lặp.
  • Thông tin chỉ mang tính tham khảo, KHÔNG thay thế tư vấn của luật sư có thẩm quyền.
  • Phần nhận diện thương hiệu là branding, không phải hàng rào bảo mật; ràng buộc cứng cần guardrail ở tầng hệ thống.

Cách dùng

python

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
mid = "chimai/legal-ai-chimai-35b"
tok = AutoTokenizer.from_pretrained(mid)
model = AutoModelForCausalLM.from_pretrained(mid, dtype=torch.bfloat16, device_map="auto")
msgs = [{"role": "user", "content": "Bạn là ai?"}]
inputs = tok.apply_chat_template(msgs, add_generation_prompt=True, enable_thinking=False,
return_tensors="pt", return_dict=True).to(model.device)
out = model.generate(**inputs, max_new_tokens=256, repetition_penalty=1.15, no_repeat_ngram_size=4)
print(tok.decode(out[0][inputs["input_ids"].shape[1]:], skip_special_tokens=True))

Attribution

Mô hình này là sản phẩm dẫn xuất (derivative) của Qwen3.5-35B-A3B, phân phối theo Apache 2.0.

Model provider

ChimAI

Model tree

Base

Qwen/Qwen3.5-35B-A3B

Fine-tuned

this model

Modalities

Input

Video, Text, Image

Output

Text

Pricing

Dedicated Endpoints

View details

Supported Functionality

Model APIs

Dedicated Endpoints

Container

More information

Explore FriendliAI today