plvictor

Alef-Biblical-1.5B-Instruct

Dedicated Endpoints

Run this model inference on single tenant GPU with unmatched speed and reliability at scale.

Learn more
Container

Run this model inference with full control and performance in your environment.

Learn more

Get help setting up a custom Dedicated Endpoints.

Talk with our engineer to get a quote for reserved GPU instances with discounts.

README

License: apache-2.0

Por que o Alef existe?

Modelos de IA especializados em Bíblia e teologia quase sempre são em inglês. A comunidade de IA brasileira ainda tem muito espaço pra crescer nesse nicho.

O Alef foi construído por um desenvolvedor solo como experimento de fine-tuning especializado em PT-BR — com dataset curado, CPT denso e SFT conversacional feito do zero. O objetivo não é ser o modelo definitivo do assunto, mas mostrar que dá pra construir isso com recursos limitados, documentar o processo abertamente, e contribuir pra comunidade brasileira de IA evoluir nessa direção.

Se você quer aprender sobre CPT, SFT, GGUF ou fine-tuning de LLMs em português — esse projeto pode ser um bom ponto de partida.


Pipeline

markdown

Polygl0t/Tucano2-qwen-1.5B-Base
↓ CPT — 368M tokens bíblicos em PT
plvictor/Alef-Biblical-1.5B-Base
↓ SFT com LoRA — ~82k exemplos conversacionais
plvictor/Alef-Biblical-1.5B-Instruct ← você está aqui

Sobre o modelo

Table
CampoValor
ArquiteturaQwen3
Parâmetros1.51B
TipoInstruction-tuned (chat)
IdiomaPortuguês Brasileiro (PT-BR)
DomínioBíblia, teologia, fé cristã
Context length4096 tokens
DtypeBFloat16

Treino — SFT

Dataset

~82.000 exemplos conversacionais gerados sobre o corpus do app Com Ele, em 24 categorias e 4 personas de usuário (iniciante, crente maduro, em crise, cético), cobrindo:

teologia · vida cristã · dor e crise · dúvida e fé · apologética · personagens bíblicos · exegese AT/NT · história bíblica · família · oração · escatologia · graça e perdão · missões · ética · relacionamentos · e mais.

Configuração

Table
ParâmetroValor
MétodoLoRA (mergeado no modelo base)
Épocas3
Steps7.080
train_loss final1.8405
eval_loss final1.8590
Tempo de treino6h 24min
GPUNVIDIA H100 NVL (95GB VRAM)
FrameworkHuggingFace Transformers + PEFT
PrecisãoBFloat16

Arquivos GGUF

Disponíveis na pasta gguf/ deste repositório:

Table
ArquivoTamanhoIdeal para
Alef-Biblical-1.5B-Q4_K_M.gguf888 MBMac (Apple Silicon / Metal), CPU
Alef-Biblical-1.5B-Q8_0.gguf1.5 GBGPU CUDA (Jetson, RTX), melhor qualidade

Nota: Use llama-cpp-python. Ollama não é recomendado para este modelo (não bufferiza bytes UTF-8 incompletos do tokenizador Qwen3).


Como usar

Transformers

python

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
model_id = "plvictor/Alef-Biblical-1.5B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id,
torch_dtype=torch.bfloat16,
device_map="auto"
)
messages = [
{"role": "system", "content": "Você se chama Alef. Ajude cristãos e buscadores a conhecerem melhor a Bíblia em português."},
{"role": "user", "content": "O que Jesus quis dizer com 'o maior entre vós será servo de todos'?"}
]
text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
inputs = tokenizer(text, return_tensors="pt").to(model.device)
output = model.generate(**inputs, max_new_tokens=512, do_sample=True, temperature=0.7)
print(tokenizer.decode(output[0][inputs.input_ids.shape[1]:], skip_special_tokens=True))

GGUF com llama-cpp-python

bash

# Mac (Metal)
CMAKE_ARGS="-DGGML_METAL=on" pip install llama-cpp-python
# CUDA (Jetson / RTX)
CMAKE_ARGS="-DGGML_CUDA=on" pip install llama-cpp-python

python

from llama_cpp import Llama
llm = Llama.from_pretrained(
repo_id="plvictor/Alef-Biblical-1.5B-Instruct",
filename="gguf/Alef-Biblical-1.5B-Q4_K_M.gguf", # ou Q8_0 pra GPU
n_gpu_layers=-1,
n_ctx=4096,
verbose=False
)
response = llm.create_chat_completion(
messages=[
{"role": "system", "content": "Você se chama Alef. Ajude cristãos e buscadores a conhecerem melhor a Bíblia em português."},
{"role": "user", "content": "Me explica o Salmo 23."}
],
max_tokens=512,
temperature=0.7
)
print(response["choices"][0]["message"]["content"])

Personalidade

O Alef foi treinado com uma voz definida:

  • Direto — quando a pergunta é simples, responde simples; quando é profunda, vai fundo
  • Acolhedor — em momentos de dor, responde como um amigo de verdade, sem papo de chatbot
  • Com convicção — fala o que acredita, não fica neutro o tempo todo como Wikipedia
  • Bom humor — leveza na hora certa
  • Não se chama de IA — é o Alef

O SFT capturou bem essa personalidade — quem testa geralmente nota a diferença em relação a modelos genéricos.


Resultados e honestidade

O Alef é um modelo de 1.5B parâmetros treinado por uma pessoa só, em alguns dias de GPU. Não compete com GPT-4 ou modelos maiores. O que ele faz bem:

  • Conversar sobre Bíblia em português com profundidade e calor humano
  • Responder perguntas teológicas e devocionais com contexto
  • Rodar localmente em hardware acessível (Mac, Jetson)

O que ele não faz tão bem:

  • Raciocínio complexo de múltiplos passos
  • Temas fora do domínio bíblico/cristão
  • Comparado a modelos 7B+, a qualidade cai em perguntas muito elaboradas

Limitações

  • Especializado em PT-BR e conteúdo cristão; não adequado para uso genérico
  • Pode refletir perspectivas teológicas do corpus de treino
  • Não substitui orientação pastoral ou aconselhamento profissional

Sobre o criador

Desenvolvido por Paulo Victor Souza — desenvolvedor brasileiro, construindo projetos de IA em português.

Site: plvictor.com · HuggingFace: plvictor


Licença

Apache 2.0

Model provider

plvictor

Model tree

Base

plvictor/Alef-Biblical-1.5B-Base

Quantized

this model

Modalities

Input

Text

Output

Text

Pricing

Dedicated Endpoints

View details

Supported Functionality

Model APIs

Dedicated Endpoints

Container

More information

Explore FriendliAI today