Assaoka
Tucano2-qwen-0.5b-Merge-FinBERT
Run this model inference on single tenant GPU with unmatched speed and reliability at scale.
Run this model inference with full control and performance in your environment.
Get help setting up a custom Dedicated Endpoints.
Talk with our engineer to get a quote for reserved GPU instances with discounts.
README
License: apache-2.0📌 Detalhes do Modelo
- Modelos Base (Merge):
Assaoka/Tucano2-qwen-0.5B-ReLiSAAssaoka/Tucano2-qwen-0.5B-BrighterAssaoka/Tucano2-qwen-0.5B-PhrasebankAssaoka/Tucano2-qwen-0.5B-GoEmotions- Tarefa: Classificação de Sentimento em notícias e relatos do mercado financeiro em português após alinhamento sequencial por Knowledge Accumulation (Prior).
- Domínio: Língua Portuguesa (PT-BR).
- Licença: Apache 2.0.
- Estratégia: Alinhamento sequencial via Knowledge Accumulation (Prior + Fine-tuning).
📊 Avaliação Completa (In-Domain & Out-Of-Domain)
Métricas padronizadas (Macro F1 · Micro F1 · Accuracy · Hamming Loss) calculadas sobre o conjunto de teste completo de cada domínio. A coluna Baseline corresponde ao modelo base Polygl0t/Tucano2-qwen-0.5B-Instruct sem fine-tuning.
| Dataset / Tarefa | Métrica | Valor | Baseline |
|---|---|---|---|
| RELI-SA | Macro F1Micro F1AccuracyHamming Loss | 40.23%56.30%56.30%0.4370 | 30.66%37.07%37.07%0.6293 |
| BRIGHTER | Macro F1Micro F1AccuracyHamming Loss | 39.47%54.66%39.11%0.1445 | 33.47%38.07%24.66%0.2731 |
| FINBERT-PT-BR | Macro F1Micro F1AccuracyHamming Loss | 79.72%81.19%81.19%0.1881 | 54.77%66.34%66.34%0.3366 |
| FINANCIAL-PHRASEBANK | Macro F1Micro F1AccuracyHamming Loss | 66.10%65.12%65.12%0.3488 | 38.13%39.32%39.32%0.6068 |
| GO-EMOTIONS | Macro F1Micro F1AccuracyHamming Loss | 21.48%32.59%27.95%0.0528 | 7.59%10.31%6.08%0.0720 |
🚀 Como utilizar o modelo (vLLM ou Transformers)
O modelo responde a prompts estruturados com instruções do sistema em português. Exemplo real de inferência estruturada:
python
from transformers import AutoModelForCausalLM, AutoTokenizermodel_id = "Assaoka/Tucano2-qwen-0.5b-Merge-FinBERT"tokenizer = AutoTokenizer.from_pretrained(model_id)model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto")messages = [{"role": "system", "content": "Você é um analista financeiro. Classifique o sentimento da frase sobre finanças em português fornecida em uma das seguintes opções: 'positivo', 'negativo', 'neutro'. Sua tarefa é retornar um JSON válido no seguinte formato: {"sentimento": "positivo/negativo/neutro"}. Responda APENAS com o JSON válido."},{"role": "user", "content": "Frase: O lucro da empresa cresceu 15% neste trimestre, superando as expectativas do mercado."}]prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)inputs = tokenizer(prompt, return_tensors="pt").to("cuda")outputs = model.generate(**inputs, max_new_tokens=100)print(tokenizer.decode(outputs[0], skip_special_tokens=True))# Resposta esperada: {"sentimento": "positivo"}
Model provider
Assaoka
Model tree
Base
Assaoka/Tucano2-qwen-0.5B-Brighter
Fine-tuned
this model
Modalities
Input
Text
Output
Text
Pricing
Dedicated Endpoints
View detailsSupported Functionality
Model APIs
Dedicated Endpoints
Container
More information