Bluechip-AI/nlng-slm-v3-gemma API & Inference Endpoint

Base model

Description

QLoRA adapter — Gemma-2-2B-IT fine-tuned on NLNG LNG domain Q&A

Training data covers NLNG's internal domain: gas supply chain, cargo scheduling, shipping logistics, LNG production, HSE compliance, thermodynamics, and commercial operations.

Usage

python
from peft import PeftModel
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
import torch

bnb_cfg   = BitsAndBytesConfig(load_in_4bit=True, bnb_4bit_quant_type="nf4",
                                bnb_4bit_compute_dtype=torch.bfloat16)
tokenizer = AutoTokenizer.from_pretrained("google/gemma-2-2b-it")
base      = AutoModelForCausalLM.from_pretrained(
                "google/gemma-2-2b-it", quantization_config=bnb_cfg, device_map="auto")
model     = PeftModel.from_pretrained(base, "Bluechip-AI/nlng-slm-v3-gemma")

prompt = "What are the key safety considerations for LNG cargo loading operations?"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
output = model.generate(**inputs, max_new_tokens=256)
print(tokenizer.decode(output[0], skip_special_tokens=True))

Training details

Table with columns: Parameter, Value
Parameter	Value
LoRA r	16
LoRA alpha	32
LoRA dropout	0.05
Quantisation	4-bit nf4
Epochs	3
Batch size	2 (grad accum 4)
Learning rate	2e-4
LR schedule	cosine

Base model

google/gemma-2-2b-it

Description

QLoRA adapter — Gemma-2-2B-IT fine-tuned on NLNG LNG domain Q&A

Training data covers NLNG's internal domain: gas supply chain, cargo scheduling, shipping logistics, LNG production, HSE compliance, thermodynamics, and commercial operations.

Usage

python
from peft import PeftModel
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
import torch

bnb_cfg   = BitsAndBytesConfig(load_in_4bit=True, bnb_4bit_quant_type="nf4",
                                bnb_4bit_compute_dtype=torch.bfloat16)
tokenizer = AutoTokenizer.from_pretrained("google/gemma-2-2b-it")
base      = AutoModelForCausalLM.from_pretrained(
                "google/gemma-2-2b-it", quantization_config=bnb_cfg, device_map="auto")
model     = PeftModel.from_pretrained(base, "Bluechip-AI/nlng-slm-v3-gemma")

prompt = "What are the key safety considerations for LNG cargo loading operations?"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
output = model.generate(**inputs, max_new_tokens=256)
print(tokenizer.decode(output[0], skip_special_tokens=True))

Training details

Table with columns: Parameter, Value
Parameter	Value
LoRA r	16
LoRA alpha	32
LoRA dropout	0.05
Quantisation	4-bit nf4
Epochs	3
Batch size	2 (grad accum 4)
Learning rate	2e-4
LR schedule	cosine

nlng-slm-v3-gemma

Get help setting up a custom Dedicated Endpoints.

README

Base model

Description

Usage

Training details

Explore FriendliAI today

README

Base model

Description

Usage

Training details