недетерминизм обучения
Зафиксировал seed, прогнал дважды, а loss всё равно скачет и F1 расходится на пару пунктов, тимлид кивает на кривые руки. На деле виноваты недетерминированные CUDA-ядра, atomic-операции на GPU, порядок редукций и многопоточность даталоадера. В разделе разбирают, как добиваться воспроизводимости в PyTorch: torch.use_deterministic_algorithms, cudnn.benchmark, фиксация worker'ов, переменные окружения, и где детерминизм стоит слишком дорого. Пригодится ML-инженерам, которым нужно отделить реальный баг от честного шума обучения.
3 тем, 20 ответов, 2 просмотров · все теги
Похожие теги:
воспроизводимость pytorch 2фиксация seed torch 1pytorch воспроизводимость 1seed обучение модели 1torch manual seed 1cuda детерминизм 1
- Темы
-
- Почему loss скачет при обучении трансформера на одной и той же конфигурации
в «Машинное обучение и Data Science» · 7 ответов · 0 просмотров · 11 июн 2026, 03:51
-
- Почему результаты обучения PyTorch не воспроизводятся даже с фиксированным seed
в «Машинное обучение и Data Science» · 6 ответов · 0 просмотров · 01 июн 2026, 03:50
-
- Почему обучение в PyTorch не воспроизводится даже с фиксированным seed
в «Машинное обучение и Data Science» · 7 ответов · 2 просмотров · 11 май 2026, 20:39