файнтюнинг

Дообучение моделей под свою задачу выглядит просто на бумаге и больно на практике. Тут делятся факапами: QLoRA на 40к саппорт-тикетов, месяц работы и модель, которая в итоге отупела и стала лоботомитом. Разбирают, где облажались с данными и гиперпараметрами, почему так легко получить переобучение на мусоре, и считают экономику аренды H100 в РФ против файнтюна на своей 4090. Главная цель разговоров - адаптировать LLM под домен и не сжечь бюджет на эксперименты, которые делают модель только тупее.

3 тем, 16 ответов, 18 просмотров · все теги

Похожие теги: Qwen 2QLoRA 2GPU 1инфраструктура 1аренда 1unsloth 1