plvictor
Alef-Biblical-1.5B-Instruct
Run this model inference on single tenant GPU with unmatched speed and reliability at scale.
Run this model inference with full control and performance in your environment.
Get help setting up a custom Dedicated Endpoints.
Talk with our engineer to get a quote for reserved GPU instances with discounts.
README
License: apache-2.0Por que o Alef existe?
Modelos de IA especializados em Bíblia e teologia quase sempre são em inglês. A comunidade de IA brasileira ainda tem muito espaço pra crescer nesse nicho.
O Alef foi construído por um desenvolvedor solo como experimento de fine-tuning especializado em PT-BR — com dataset curado, CPT denso e SFT conversacional feito do zero. O objetivo não é ser o modelo definitivo do assunto, mas mostrar que dá pra construir isso com recursos limitados, documentar o processo abertamente, e contribuir pra comunidade brasileira de IA evoluir nessa direção.
Se você quer aprender sobre CPT, SFT, GGUF ou fine-tuning de LLMs em português — esse projeto pode ser um bom ponto de partida.
Pipeline
markdown
Polygl0t/Tucano2-qwen-1.5B-Base↓ CPT — 368M tokens bíblicos em PTplvictor/Alef-Biblical-1.5B-Base↓ SFT com LoRA — ~82k exemplos conversacionaisplvictor/Alef-Biblical-1.5B-Instruct ← você está aqui
Sobre o modelo
| Campo | Valor |
|---|---|
| Arquitetura | Qwen3 |
| Parâmetros | 1.51B |
| Tipo | Instruction-tuned (chat) |
| Idioma | Português Brasileiro (PT-BR) |
| Domínio | Bíblia, teologia, fé cristã |
| Context length | 4096 tokens |
| Dtype | BFloat16 |
Treino — SFT
Dataset
~82.000 exemplos conversacionais gerados sobre o corpus do app Com Ele, em 24 categorias e 4 personas de usuário (iniciante, crente maduro, em crise, cético), cobrindo:
teologia · vida cristã · dor e crise · dúvida e fé · apologética · personagens bíblicos · exegese AT/NT · história bíblica · família · oração · escatologia · graça e perdão · missões · ética · relacionamentos · e mais.
Configuração
| Parâmetro | Valor |
|---|---|
| Método | LoRA (mergeado no modelo base) |
| Épocas | 3 |
| Steps | 7.080 |
| train_loss final | 1.8405 |
| eval_loss final | 1.8590 |
| Tempo de treino | 6h 24min |
| GPU | NVIDIA H100 NVL (95GB VRAM) |
| Framework | HuggingFace Transformers + PEFT |
| Precisão | BFloat16 |
Arquivos GGUF
Disponíveis na pasta gguf/ deste repositório:
| Arquivo | Tamanho | Ideal para |
|---|---|---|
Alef-Biblical-1.5B-Q4_K_M.gguf | 888 MB | Mac (Apple Silicon / Metal), CPU |
Alef-Biblical-1.5B-Q8_0.gguf | 1.5 GB | GPU CUDA (Jetson, RTX), melhor qualidade |
Nota: Use
llama-cpp-python. Ollama não é recomendado para este modelo (não bufferiza bytes UTF-8 incompletos do tokenizador Qwen3).
Como usar
Transformers
python
from transformers import AutoTokenizer, AutoModelForCausalLMimport torchmodel_id = "plvictor/Alef-Biblical-1.5B-Instruct"tokenizer = AutoTokenizer.from_pretrained(model_id)model = AutoModelForCausalLM.from_pretrained(model_id,torch_dtype=torch.bfloat16,device_map="auto")messages = [{"role": "system", "content": "Você se chama Alef. Ajude cristãos e buscadores a conhecerem melhor a Bíblia em português."},{"role": "user", "content": "O que Jesus quis dizer com 'o maior entre vós será servo de todos'?"}]text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)inputs = tokenizer(text, return_tensors="pt").to(model.device)output = model.generate(**inputs, max_new_tokens=512, do_sample=True, temperature=0.7)print(tokenizer.decode(output[0][inputs.input_ids.shape[1]:], skip_special_tokens=True))
GGUF com llama-cpp-python
bash
# Mac (Metal)CMAKE_ARGS="-DGGML_METAL=on" pip install llama-cpp-python# CUDA (Jetson / RTX)CMAKE_ARGS="-DGGML_CUDA=on" pip install llama-cpp-python
python
from llama_cpp import Llamallm = Llama.from_pretrained(repo_id="plvictor/Alef-Biblical-1.5B-Instruct",filename="gguf/Alef-Biblical-1.5B-Q4_K_M.gguf", # ou Q8_0 pra GPUn_gpu_layers=-1,n_ctx=4096,verbose=False)response = llm.create_chat_completion(messages=[{"role": "system", "content": "Você se chama Alef. Ajude cristãos e buscadores a conhecerem melhor a Bíblia em português."},{"role": "user", "content": "Me explica o Salmo 23."}],max_tokens=512,temperature=0.7)print(response["choices"][0]["message"]["content"])
Personalidade
O Alef foi treinado com uma voz definida:
- Direto — quando a pergunta é simples, responde simples; quando é profunda, vai fundo
- Acolhedor — em momentos de dor, responde como um amigo de verdade, sem papo de chatbot
- Com convicção — fala o que acredita, não fica neutro o tempo todo como Wikipedia
- Bom humor — leveza na hora certa
- Não se chama de IA — é o Alef
O SFT capturou bem essa personalidade — quem testa geralmente nota a diferença em relação a modelos genéricos.
Resultados e honestidade
O Alef é um modelo de 1.5B parâmetros treinado por uma pessoa só, em alguns dias de GPU. Não compete com GPT-4 ou modelos maiores. O que ele faz bem:
- Conversar sobre Bíblia em português com profundidade e calor humano
- Responder perguntas teológicas e devocionais com contexto
- Rodar localmente em hardware acessível (Mac, Jetson)
O que ele não faz tão bem:
- Raciocínio complexo de múltiplos passos
- Temas fora do domínio bíblico/cristão
- Comparado a modelos 7B+, a qualidade cai em perguntas muito elaboradas
Limitações
- Especializado em PT-BR e conteúdo cristão; não adequado para uso genérico
- Pode refletir perspectivas teológicas do corpus de treino
- Não substitui orientação pastoral ou aconselhamento profissional
Sobre o criador
Desenvolvido por Paulo Victor Souza — desenvolvedor brasileiro, construindo projetos de IA em português.
Site: plvictor.com · HuggingFace: plvictor
Licença
Apache 2.0
Model provider
plvictor
Model tree
Base
plvictor/Alef-Biblical-1.5B-Base
Quantized
this model
Modalities
Input
Text
Output
Text
Pricing
Dedicated Endpoints
View detailsSupported Functionality
Model APIs
Dedicated Endpoints
Container
More information