Llama3_1_8B_Finance_QLoRA-merged-16bit API & Inference Endpoint

Evaluation Results

Table with columns: Dataset, Base Accuracy, FT Accuracy, Base Macro-F1, FT Macro-F1
Dataset	Base Accuracy	FT Accuracy	Base Macro-F1	FT Macro-F1
FPB in-domain	0.8908	0.9748	0.8765	0.9725
FiQA-SA OOD	0.8120	0.9402	0.6705	0.8335

Baseline = zero-shot Meta-Llama-3.1-8B-Instruct with the same prompt template.

Quick Start

python
from peft import PeftModel
from transformers import AutoModelForCausalLM, AutoTokenizer

base = AutoModelForCausalLM.from_pretrained(
    "meta-llama/Meta-Llama-3.1-8B-Instruct",
    load_in_4bit=True,
    device_map="auto",
)
model     = PeftModel.from_pretrained(base, "jhon53/Llama3_1_8B_Finance_QLoRA")
tokenizer = AutoTokenizer.from_pretrained("jhon53/Llama3_1_8B_Finance_QLoRA")

Training Details

Table with columns: Param, Value
Param	Value
Base model	meta-llama/Meta-Llama-3.1-8B-Instruct
Method	QLoRA (4-bit NF4 + LoRA bf16)
LoRA rank (r)	16
LoRA alpha	32
LoRA dropout	0.05
Target modules	q, k, v, o, gate, up, down projections
Training data	FinGPT/fingpt-sentiment-train (~76k)
Optimizer	AdamW 8-bit
Learning rate

GGUF q4_k_m: jhon53/Llama3_1_8B_Finance_QLoRA-GGUF
model: jhon53/Llama3_1_8B_Finance_QLoRA

Uploaded finetuned model

Developed by: jhon53
License: apache-2.0
Finetuned from model : unsloth/Meta-Llama-3.1-8B-Instruct-bnb-4bit

Evaluation Results

Table with columns: Dataset, Base Accuracy, FT Accuracy, Base Macro-F1, FT Macro-F1
Dataset	Base Accuracy	FT Accuracy	Base Macro-F1	FT Macro-F1
FPB in-domain	0.8908	0.9748	0.8765	0.9725
FiQA-SA OOD	0.8120	0.9402	0.6705	0.8335

Baseline = zero-shot Meta-Llama-3.1-8B-Instruct with the same prompt template.

Quick Start

python
from peft import PeftModel
from transformers import AutoModelForCausalLM, AutoTokenizer

base = AutoModelForCausalLM.from_pretrained(
    "meta-llama/Meta-Llama-3.1-8B-Instruct",
    load_in_4bit=True,
    device_map="auto",
)
model     = PeftModel.from_pretrained(base, "jhon53/Llama3_1_8B_Finance_QLoRA")
tokenizer = AutoTokenizer.from_pretrained("jhon53/Llama3_1_8B_Finance_QLoRA")

Training Details

Table with columns: Param, Value
Param	Value
Base model	meta-llama/Meta-Llama-3.1-8B-Instruct
Method	QLoRA (4-bit NF4 + LoRA bf16)
LoRA rank (r)	16
LoRA alpha	32
LoRA dropout	0.05
Target modules	q, k, v, o, gate, up, down projections
Training data	FinGPT/fingpt-sentiment-train (~76k)
Optimizer	AdamW 8-bit
Learning rate

GGUF q4_k_m: jhon53/Llama3_1_8B_Finance_QLoRA-GGUF
model: jhon53/Llama3_1_8B_Finance_QLoRA

Uploaded finetuned model

Developed by: jhon53
License: apache-2.0
Finetuned from model : unsloth/Meta-Llama-3.1-8B-Instruct-bnb-4bit

Llama3_1_8B_Finance_QLoRA-merged-16bit

README

Evaluation Results

Quick Start

Training Details

Uploaded finetuned model

Explore FriendliAI today

README

Evaluation Results

Quick Start

Training Details

Uploaded finetuned model

Llama3_1_8B_Finance_QLoRA-merged-16bit

README

Evaluation Results

Quick Start

Training Details

Related Repos

Uploaded finetuned model

Explore FriendliAI today

README

Evaluation Results

Quick Start

Training Details

Related Repos

Uploaded finetuned model