Assaoka

Tucano2-qwen-0.5b-Merge-FinBERT

Deploy Dedicated

Dedicated Endpoints

Run this model inference on single tenant GPU with unmatched speed and reliability at scale.

Learn more

Container

Run this model inference with full control and performance in your environment.

Learn more

Get help setting up a custom Dedicated Endpoints.

Talk with our engineer to get a quote for reserved GPU instances with discounts.

README

License: apache-2.0

📌 Detalhes do Modelo

Modelos Base (Merge):
Assaoka/Tucano2-qwen-0.5B-ReLiSA
Assaoka/Tucano2-qwen-0.5B-Brighter
Assaoka/Tucano2-qwen-0.5B-Phrasebank
Assaoka/Tucano2-qwen-0.5B-GoEmotions
Tarefa: Classificação de Sentimento em notícias e relatos do mercado financeiro em português após alinhamento sequencial por Knowledge Accumulation (Prior).
Domínio: Língua Portuguesa (PT-BR).
Licença: Apache 2.0.
Estratégia: Alinhamento sequencial via Knowledge Accumulation (Prior + Fine-tuning).

📊 Avaliação Completa (In-Domain & Out-Of-Domain)

Métricas padronizadas (Macro F1 · Micro F1 · Accuracy · Hamming Loss) calculadas sobre o conjunto de teste completo de cada domínio. A coluna Baseline corresponde ao modelo base Polygl0t/Tucano2-qwen-0.5B-Instruct sem fine-tuning.

Table
Dataset / Tarefa	Métrica	Valor	Baseline
RELI-SA	Macro F1Micro F1AccuracyHamming Loss	40.23%56.30%56.30%0.4370	30.66%37.07%37.07%0.6293
BRIGHTER	Macro F1Micro F1AccuracyHamming Loss	39.47%54.66%39.11%0.1445	33.47%38.07%24.66%0.2731
FINBERT-PT-BR	Macro F1Micro F1AccuracyHamming Loss	79.72%81.19%81.19%0.1881	54.77%66.34%66.34%0.3366
FINANCIAL-PHRASEBANK	Macro F1Micro F1AccuracyHamming Loss	66.10%65.12%65.12%0.3488	38.13%39.32%39.32%0.6068
GO-EMOTIONS	Macro F1Micro F1AccuracyHamming Loss	21.48%32.59%27.95%0.0528	7.59%10.31%6.08%0.0720

🚀 Como utilizar o modelo (vLLM ou Transformers)

O modelo responde a prompts estruturados com instruções do sistema em português. Exemplo real de inferência estruturada:

python
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "Assaoka/Tucano2-qwen-0.5b-Merge-FinBERT"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto")

messages = [
    {"role": "system", "content": "Você é um analista financeiro. Classifique o sentimento da frase sobre finanças em português fornecida em uma das seguintes opções: 'positivo', 'negativo', 'neutro'. Sua tarefa é retornar um JSON válido no seguinte formato: {"sentimento": "positivo/negativo/neutro"}. Responda APENAS com o JSON válido."},
    {"role": "user", "content": "Frase: O lucro da empresa cresceu 15% neste trimestre, superando as expectativas do mercado."}
]

prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
# Resposta esperada: {"sentimento": "positivo"}