файнтюнинг

Дообучение моделей под свою задачу выглядит просто на бумаге и больно на практике. Тут делятся факапами: QLoRA на 40к саппорт-тикетов, месяц работы и модель, которая в итоге отупела и стала лоботомитом. Разбирают, где облажались с данными и гиперпараметрами, почему так легко получить переобучение на мусоре, и считают экономику аренды H100 в РФ против файнтюна на своей 4090. Главная цель разговоров - адаптировать LLM под домен и не сжечь бюджет на эксперименты, которые делают модель только тупее.

3 тем, 16 ответов, 18 просмотров · все теги

Похожие теги: Qwen 2 QLoRA 2 GPU 1 инфраструктура 1 аренда 1 unsloth 1

Темы

Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа
в «Локальные LLM и open-source модели» · 4 ответов · 8 просмотров · 11 июн 2026, 02:27
Посчитал аренду H100 в РФ против своей 4090 под файнтюны и загрустил
в «Машинное обучение и Data Science» · 5 ответов · 8 просмотров · 31 май 2026, 23:59
QLoRA на 40к саппорт-тикетов: месяц работы, модель отупела. Где я облажался?
в «Локальные LLM и open-source модели» · 7 ответов · 2 просмотров · 17 май 2026, 05:34