armand0e

qwen3.5-2b-opus-repair-stage3-polish-lora

Deploy Dedicated

Run Status

Status: complete_skipped
Adapter present: True
Latest checkpoint: outputs/qwen-pipeline/stage3-polish-sft/checkpoint-105
Best checkpoint: outputs/qwen-pipeline/stage3-polish-sft/checkpoint-105
Best eval loss: 2.238168716430664
Trainer state: outputs/qwen-pipeline/stage3-polish-sft/trainer_state.json
Global step: 105
First Loss: 0.9087384939193726
Final Loss: 1.2894536256790161
Min Loss: 0.3923358619213104
Max Loss: 1.3626806735992432
Loss Points: 105
First Eval Loss: 2.2553348541259766
Final Eval Loss: 2.238168716430664
Min Eval Loss: 2.238168716430664
Max Eval Loss: 2.2553348541259766
Eval Loss Points: 6
Best Eval Loss: 2.238168716430664
Best Global Step: 105
Train Runtime S: 1791.1341

Generated files:

training_config.json
stage_report.json
loss_history.csv
loss_curve.svg
eval_loss_history.csv
eval_loss_curve.svg

Loss curve

Eval loss curve

Context

Purpose: Short full-trajectory polish after step slicing.
Previous adapter: armand0e/qwen3.5-2b-opus-repair-stage2-lora
Next stage: stage4-dpo
Base model: Qwen/Qwen3.5-2B
Data file: data/assembled/sft_qwen_messages_chat_repair.jsonl
Eval file: data/eval/eval_sft.jsonl
LoRA r/alpha/dropout: 32 / 32 / 0.0
Learning rate: 1e-06
Epochs:

Upstream Data

armand0e/qwen3.7-max-pi-traces
armand0e/badlogicgames-pi-mono-opus-filtered
armand0e/gpt-5.5-agent
armand0e/gpt-5.5-chat
TeichAI/claude-4.5-opus-high-reasoning-250x
TeichAI/Claude-Opus-4.6-Reasoning-887x

Compact Local Sample

json
{
  "messages": [
    {
      "role": "user",
      "content": "Develop Python code to implement a recommendation system using collaborative filtering."
    },
    {
      "role": "assistant",
      "content": "# Collaborative Filtering Recommendation System in Python\n\nI'll create a comprehensive recommendation system implementation covering user-based, item-based collaborative filtering, and matrix factorization approaches.\n\n## Project Structure\n\n'''\nrecommendation_system/\n├── recommendation_system.py   # Core implementation\n├── matrix_factorization.py    # SVD-based approach\n├── evaluation.py              # Evaluation metrics\n├── demo.py                    # Usage examples\n└── requirements.txt           # Dependencies\n'''\n\n## 1. Core Recommendation System\n\n'''python\n\"\"\"\nrecommendation_system.py\nCollaborative Filtering Recommendation System Implementation\n\"\"\"\n\nimport numpy as np\nimport pandas as pd\nfrom abc import ABC, abstractmethod\nfrom collections import defaultdict\nfrom typing import List, Tuple, Dict, Optional, Set\nfrom scipy.sparse import csr_matrix\nfrom scipy.spatial.distance import cosine\nimport warnings\nwarnings.filterwarnings('ignore'
...[truncated]

Reproduction

The exact stage command and package versions are in training_config.json.

Available on FriendliAI

Dedicated Endpoints

Run this model inference on single tenant GPU with unmatched speed and reliability at scale.

Learn more

Model Details

Model Provider

armand0e

Model Tree

Base

Qwen/Qwen3.5-2B

Adapter

this model

Input Modalities

Text

Image

Video

Output Modalities

Text

Supported Functionality

Dedicated Endpoints

Explore FriendliAI today

Get started Talk to an engineer

Run Status

Status: complete_skipped
Adapter present: True
Latest checkpoint: outputs/qwen-pipeline/stage3-polish-sft/checkpoint-105
Best checkpoint: outputs/qwen-pipeline/stage3-polish-sft/checkpoint-105
Best eval loss: 2.238168716430664
Trainer state: outputs/qwen-pipeline/stage3-polish-sft/trainer_state.json
Global step: 105
First Loss: 0.9087384939193726
Final Loss: 1.2894536256790161
Min Loss: 0.3923358619213104
Max Loss: 1.3626806735992432
Loss Points: 105
First Eval Loss: 2.2553348541259766
Final Eval Loss: 2.238168716430664
Min Eval Loss: 2.238168716430664
Max Eval Loss: 2.2553348541259766
Eval Loss Points: 6
Best Eval Loss: 2.238168716430664
Best Global Step: 105
Train Runtime S: 1791.1341

Generated files:

training_config.json
stage_report.json
loss_history.csv
loss_curve.svg
eval_loss_history.csv
eval_loss_curve.svg

Loss curve

Eval loss curve

Context

Purpose: Short full-trajectory polish after step slicing.
Previous adapter: armand0e/qwen3.5-2b-opus-repair-stage2-lora
Next stage: stage4-dpo
Base model: Qwen/Qwen3.5-2B
Data file: data/assembled/sft_qwen_messages_chat_repair.jsonl
Eval file: data/eval/eval_sft.jsonl
LoRA r/alpha/dropout: 32 / 32 / 0.0
Learning rate: 1e-06
Epochs:

Upstream Data

armand0e/qwen3.7-max-pi-traces
armand0e/badlogicgames-pi-mono-opus-filtered
armand0e/gpt-5.5-agent
armand0e/gpt-5.5-chat
TeichAI/claude-4.5-opus-high-reasoning-250x
TeichAI/Claude-Opus-4.6-Reasoning-887x

Compact Local Sample

json
{
  "messages": [
    {
      "role": "user",
      "content": "Develop Python code to implement a recommendation system using collaborative filtering."
    },
    {
      "role": "assistant",
      "content": "# Collaborative Filtering Recommendation System in Python\n\nI'll create a comprehensive recommendation system implementation covering user-based, item-based collaborative filtering, and matrix factorization approaches.\n\n## Project Structure\n\n'''\nrecommendation_system/\n├── recommendation_system.py   # Core implementation\n├── matrix_factorization.py    # SVD-based approach\n├── evaluation.py              # Evaluation metrics\n├── demo.py                    # Usage examples\n└── requirements.txt           # Dependencies\n'''\n\n## 1. Core Recommendation System\n\n'''python\n\"\"\"\nrecommendation_system.py\nCollaborative Filtering Recommendation System Implementation\n\"\"\"\n\nimport numpy as np\nimport pandas as pd\nfrom abc import ABC, abstractmethod\nfrom collections import defaultdict\nfrom typing import List, Tuple, Dict, Optional, Set\nfrom scipy.sparse import csr_matrix\nfrom scipy.spatial.distance import cosine\nimport warnings\nwarnings.filterwarnings('ignore'
...[truncated]

Reproduction

The exact stage command and package versions are in training_config.json.

qwen3.5-2b-opus-repair-stage3-polish-lora

README

Run Status

Context

Upstream Data

Compact Local Sample

Reproduction

Explore FriendliAI today

README

Run Status

Context

Upstream Data

Compact Local Sample

Reproduction