воспроизводимость pytorch

Зафиксировал seed, а F1 все равно пляшет от запуска к запуску, и неделя уходит на охоту за призраком. Эта подборка про недетерминизм в PyTorch: почему обучение не повторяется бит в бит даже с зафиксированным зерном, при чем тут недетерминированные CUDA-кернелы, atomic-операции на GPU, порядок редукций и cudnn.benchmark. Разбираем torch.use_deterministic_algorithms, переменные окружения, цену детерминизма по скорости и то, как отличить кривые руки от честной природы железа и фреймворка.

4 тем, 26 ответов, 2 просмотров · все теги

Похожие теги: недетерминизм cuda 2недетерминизм обучения 2seed нейросети 1фиксация seed torch 1torch manual seed 1cuda детерминизм 1разный результат обучения 1