plvictor

Alef-Biblical-1.5B-Base

Dedicated Endpoints

Run this model inference on single tenant GPU with unmatched speed and reliability at scale.

Learn more
Container

Run this model inference with full control and performance in your environment.

Learn more

Get help setting up a custom Dedicated Endpoints.

Talk with our engineer to get a quote for reserved GPU instances with discounts.

README

License: apache-2.0

Por que o Alef existe?

A maioria dos modelos de IA especializados em Bíblia e teologia é em inglês. A comunidade de IA brasileira ainda tem muito espaço pra crescer nesse nicho — e o Alef nasceu justamente disso: a vontade de construir algo em português, com cuidado, e de compartilhar o processo de forma aberta.

Este projeto foi desenvolvido por um desenvolvedor solo como experimento de fine-tuning especializado em PT-BR. O objetivo não é competir com grandes modelos — é mostrar que dá pra fazer isso com acesso limitado, documentar o caminho, e ajudar a comunidade brasileira de IA a evoluir junto.


Sobre o modelo

Table
CampoValor
ArquiteturaQwen3
Parâmetros1.51B
TipoBase (text completion)
IdiomaPortuguês Brasileiro (PT-BR)
DomínioBíblia, teologia, fé cristã
Context length4096 tokens
DtypeBFloat16

Modelo base: Polygl0t/Tucano2-qwen-1.5B-Base — modelo base para português da família Qwen3.


Treino — Continued Pre-Training (CPT)

O modelo passou por CPT em um corpus bíblico curado de ~368 milhões de tokens em português, cobrindo devocionais, estudos, planos de leitura, Bíblias em múltiplas traduções e conteúdo de sites teológicos.

Dataset

Table
FonteDocumentosTokens est.
Devocionais — app Com Ele157.910~102M
Planos de leitura — app Com Ele35.956~189M
Estudos bíblicos — app Com Ele5.000~20M
Q&A bíblico — app Com Ele15.843~13M
Bíblia em 10 traduções PT — app Com Ele11.437~10M
Resumos e análises de livros — app Com Ele2.378~1M
Personagens, mapas, contexto histórico — app Com Ele~2.000~0.7M
Sintético (GPT-4.1)982~2.5M
voltemosaoevangelho.com5.529~14M
bibliotecadopregador.com.br4.276~10M
estudobiblico.org558~4M
pt.ligonier.org726~2M
Total241.167~368M

Configuração

Table
ParâmetroValor
TipoFull fine-tuning (CPT)
PrecisãoBFloat16
AttentionSDPA
Tokens por step~540k
GPUNVIDIA H100 NVL (95GB VRAM)
FrameworkHuggingFace Transformers

Uso

python

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
model_id = "plvictor/Alef-Biblical-1.5B-Base"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id,
torch_dtype=torch.bfloat16,
device_map="auto"
)
prompt = "O livro de Jó nos ensina que o sofrimento"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
output = model.generate(**inputs, max_new_tokens=200, do_sample=True, temperature=0.7)
print(tokenizer.decode(output[0], skip_special_tokens=True))

Para conversa e assistência bíblica, use plvictor/Alef-Biblical-1.5B-Instruct.


Limitações

  • Modelo pequeno (1.5B): bom pra consultas e conversas bíblicas, não substitui modelos maiores em raciocínio complexo
  • Especializado em PT-BR e conteúdo cristão — não adequado para uso genérico
  • Pode refletir perspectivas teológicas predominantes no corpus

Sobre o criador

Desenvolvido por Paulo Victor Souza — desenvolvedor brasileiro, construindo projetos de IA em português. Site: plvictor.com


Licença

Apache 2.0

Model provider

plvictor

Model tree

Base

Polygl0t/Tucano2-qwen-1.5B-Base

Fine-tuned

this model

Modalities

Input

Text

Output

Text

Pricing

Dedicated Endpoints

View details

Supported Functionality

Model APIs

Dedicated Endpoints

Container

More information

Explore FriendliAI today