Dedicated Endpoints

Run this model inference on single tenant GPU with unmatched speed and reliability at scale.

Learn more

Get help setting up a custom Dedicated Endpoints.

Talk with our engineer to get a quote for reserved GPU instances with discounts.

README

Результат

Официальная оценка выполнена через lmms-eval на полном gqa-ru testdev split без --limit. Модель получала изображения и вопросы. Для воспроизводимого короткого ответа использовался enable_thinking=False.

МодельSamplesExactMatchCorrect
Qwen/Qwen3.5-0.8B12 2160.28623 496
LoRA adapter12 2160.48325 903

Улучшение: +0.1970 ExactMatch absolute, +68.85% relative, +2 407 правильных ответов.

Данные

Использован открытый датасет deepvk/GQA-ru. Локальные JSONL-манифесты содержали путь к изображению, русский вопрос и эталонный ответ.

SplitSamples
train38 019
validation1 981
testdev12 216

Обучение

Обучение было мультимодальным: processor получал изображения, вопросы и ответы. Vision encoder оставался замороженным, а LoRA обучалась в language model attention слоях, адаптируя обработку visual tokens для русскоязычного VQA.

ПараметрЗначение
Base modelQwen/Qwen3.5-0.8B
AdapterLoRA
Target modulesq_proj, k_proj, v_proj, o_proj
Rank / alpha / dropout16 / 32 / 0.05
Epochs1.0
Batch size8
Learning rate2e-4
Precisionbf16
Seed42
Best checkpointcheckpoint-4560
Training metricValue
train_loss0.04432422036801592
eval_loss0.4337001144886017
train_runtime_sec6219.1947

Использование

python

from peft import PeftModel
from transformers import AutoProcessor, Qwen3_5ForConditionalGeneration
base = "Qwen/Qwen3.5-0.8B"
adapter = "lockR/vk-vlm-gqa-ru-qwen35-08b-lora"
processor = AutoProcessor.from_pretrained(base, trust_remote_code=True)
model = Qwen3_5ForConditionalGeneration.from_pretrained(base, trust_remote_code=True)
model = PeftModel.from_pretrained(model, adapter)

Ограничения

  • Vision encoder не дообучался: LoRA применяется только к language model слоям.
  • Результат измерен на GQA-ru; качество на других доменах и MMBench-ru не подтверждено.
  • Модель может наследовать ограничения и смещения базовой модели и датасета.

Репозиторий проекта

https://github.com/L0ckR/VK_education_vllm

Model provider

lockR

Model tree

Base

Qwen/Qwen3.5-0.8B

Adapter

this model

Modalities

Input

Video, Text, Image

Output

Text

Pricing

Dedicated Endpoints

View details

Supported Functionality

Model APIs

Dedicated Endpoints

Container

More information

Explore FriendliAI today