Поставил все сиды, а loss всё равно гуляет между запусками — кто победил недетерминизм в PyTorch?

Теги: #GPU
Рейтинг: 51.8% · 22 голосов
Machine learning и deep learning: обучение и дообучение моделей, датасеты, PyTorch, TensorFlow, эксперименты, метрики, MLOps и аналитика данных.
Аватара пользователя
vadim_daemon
Сообщения: 3
Зарегистрирован: Пн май 25, 2026 12:58 pm

Re: Поставил все сиды, а loss всё равно гуляет между запусками — кто победил недетерминизм в PyTorch?

Сообщение vadim_daemon »

Кстати, между версиями torch вообще никто не обещает воспроизводимость. У меня модель обученная на 1.13 и 2.1 давала разный loss на одинаковом сиде, потому что поменяли реализацию SDPA (flash attention). Так что зафиксируйте ещё и версию в requirements намертво.
👍 ❤️1 🔥 😄 🤔
✔ Лучший ответ сформирован автоматически — ios_dev
Вот это и есть главная боль. Детерминизм включил — а оно тебе половину ядер выключило и обучение замедлилось процентов на 20-30. У меня resnet50 с deterministic просел с 1.4 it/s до 1.05. Не всегда оно того стоит.
Перейти к ответу →
Аватара пользователя
tcploop1339
Сообщения: 29
Зарегистрирован: Пн май 11, 2026 1:27 am

Re: Поставил все сиды, а loss всё равно гуляет между запусками — кто победил недетерминизм в PyTorch?

Сообщение tcploop1339 »

+1 к фиксации версий. И не только torch, а cuda toolkit и драйвер. cudnn между минорными версиями тоже алгоритмы свопает.
👍 ❤️1 🔥 😄 🤔1
Аватара пользователя
roman_ml29
Сообщения: 4
Зарегистрирован: Пн май 11, 2026 4:36 am

Re: Поставил все сиды, а loss всё равно гуляет между запусками — кто победил недетерминизм в PyTorch?

Сообщение roman_ml29 »

Замечу: bench=False убивает автотюнинг свёрток, для фиксированного размера входа это прям больно. Если у тебя image size постоянный, benchmark=True наоборот ускоряет, но ценой недетерминизма. Классический trade-off.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
arseny_cache
Сообщения: 3
Зарегистрирован: Вс май 24, 2026 3:35 am

Re: Поставил все сиды, а loss всё равно гуляет между запусками — кто победил недетерминизм в PyTorch?

Сообщение arseny_cache »

А я думал поставил seed=42 и всё, как в туториалах пишут ))) оказывается там целый ад под капотом
👍2 ❤️ 🔥 😄 🤔
Аватара пользователя
jscode1641
Сообщения: 32
Зарегистрирован: Ср май 13, 2026 9:49 am

Re: Поставил все сиды, а loss всё равно гуляет между запусками — кто победил недетерминизм в PyTorch?

Сообщение jscode1641 »

@ai_enjoyer ага, seed=42 в ноутбуке на CPU работает прекрасно. А потом ты выкатываешь на мультигпу с DDP и понимаешь что у каждого ранка свой сид нужен, иначе все воркеры генерят одинаковые аугментации и ты фактически уменьшаешь разнообразие данных.
👍1 ❤️ 🔥2 😄 🤔
Аватара пользователя
ivan4259
Сообщения: 5
Зарегистрирован: Вт май 19, 2026 4:17 am

Re: Поставил все сиды, а loss всё равно гуляет между запусками — кто победил недетерминизм в PyTorch?

Сообщение ivan4259 »

Короче подытожу что у меня сейчас работает приемлемо: generator с manual_seed в DataLoader, num_workers оставил 8 но с worker_init_fn, use_deterministic_algorithms(True), CUBLAS_WORKSPACE_CONFIG в env, версии заморожены. Bit-exact на GPU так и не получил между разными машинами, но на одной и той же — да. Между CPU и GPU даже не пытаюсь, это в доке прямо написано что не гарантируется.
👍 ❤️ 🔥1 😄 🤔
Аватара пользователя
luka_lab
Сообщения: 5
Зарегистрирован: Вт май 12, 2026 10:11 pm

Re: Поставил все сиды, а loss всё равно гуляет между запусками — кто победил недетерминизм в PyTorch?

Сообщение luka_lab »

Прочитал тред и вспомнил почему я полгода назад просто стал прогонять по 3 сида и репортить mean±std. Спокойствие дороже.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
roman_sigma
Сообщения: 13
Зарегистрирован: Пн май 11, 2026 2:24 am

Re: Поставил все сиды, а loss всё равно гуляет между запусками — кто победил недетерминизм в PyTorch?

Сообщение roman_sigma »

@senior_burnout честно, к этому и иду. Спасибо всем, реально помогли.
👍1 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Машинное обучение и Data Science»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей