Одинаковый seed, два запуска подряд, разница в F1 два пункта. тимлид говорит руки кривые
Рейтинг: 0% · 0 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Одинаковый seed, два запуска подряд, разница в F1 два пункта. тимлид говорит руки кривые
Ситуация. Дообучаю rubert-tiny2 на классификацию обращений, 40к примеров. Зафиксировал всё что можно: torch.manual_seed, numpy, random, PYTHONHASHSEED, cudnn.deterministic=True, cudnn.benchmark=False. Запускаю один и тот же скрипт два раза подряд на одной и той же арендованной A100. F1 на тесте 0.714 и 0.733.
Тимлид считает что я где-то налажал и детерминизм достижим, цитирую, за пять минут. Я уже два дня ковыряю и не понимаю откуда разброс. Кто прав?
Тимлид считает что я где-то налажал и детерминизм достижим, цитирую, за пять минут. Я уже два дня ковыряю и не понимаю откуда разброс. Кто прав?
✔ Лучший ответ сформирован автоматически — coldpanic
torch.use_deterministic_algorithms(True) ставил? cudnn.deterministic это только про cudnn, половина операций идёт мимо него. и переменную CUBLAS_WORKSPACE_CONFIG=:4096:8 в окружение. после этого либо станет воспроизводимо, либо торч честно кинет ошибку на недетерминированной операции и ты увидишь виновника. обычно это scatter или index_add
Re: Одинаковый seed, два запуска подряд, разница в F1 два пункта. тимлид говорит руки кривые
✔ Лучший ответ — сформирован автоматически
torch.use_deterministic_algorithms(True) ставил? cudnn.deterministic это только про cudnn, половина операций идёт мимо него. и переменную CUBLAS_WORKSPACE_CONFIG=:4096:8 в окружение. после этого либо станет воспроизводимо, либо торч честно кинет ошибку на недетерминированной операции и ты увидишь виновника. обычно это scatter или index_add
Re: Одинаковый seed, два запуска подряд, разница в F1 два пункта. тимлид говорит руки кривые
а тест какого размера? если пара тысяч примеров, то 2 пункта F1 это может быть обычный шум, и весь спор ни о чём. запусти 10 раз с разными сидами, посчитай среднее и std. если std около 0.008, то 0.714 и 0.733 оба нормальные, просто хвосты распределения. в отчёте пиши 0.72 +- 0.01 и закрыли тему
Re: Одинаковый seed, два запуска подряд, разница в F1 два пункта. тимлид говорит руки кривые
тимлиду передай, что за пять минут детерминизм достигается только в sklearn на проце. на gpu атомарные операции складывают флоаты в произвольном порядке, а (a+b)+c != a+(b+c). полный детерминизм возможен, но стоит до 30% скорости и пары дней дебага. кто с гпу работал, тот в цирке не смеётся
- ansible777
- Сообщения: 46
- Зарегистрирован: 11 май 2026, 10:14
- envoywizard
- Сообщения: 14
- Зарегистрирован: 11 май 2026, 20:41
Re: Одинаковый seed, два запуска подряд, разница в F1 два пункта. тимлид говорит руки кривые
@redisguru, два дня на это, бл. бизнесу всё равно, 0.71 у вас или 0.73, он разницы не увидит. лучше бы данные почистил, там обычно лежат не два пункта, а десять
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- Поставил все сиды, а loss всё равно гуляет между запусками — кто победил недетерминизм в PyTorch?
17 ответов · 722 просмотров
-
-
-
-
- Ollama vs llama.cpp напрямую — реально ли 23% разница в скорости или маркетинг?
6 ответов · 21 просмотров
-
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей