Linux: Ubuntu 16.04.3 LTS (GNU/Linux 4.10.0-38-общий x86_64)
Tensorflow: компилировать из исходников, 1.4
Графический процессор: 4xP100
Я пробую новую выпущенную обучающую программу по обнаружению объектов. Я заметил, что есть большая разница, когда я устанавливаю CUDA_VISIBLE_DEVICES в другое значение. В частности, когда он установлен на «gpu: 0», утилита gpu довольно высока, например, 80–90%, но когда я устанавливаю ее для других устройств gpu, таких как gpu: 1, gpu: 2 и т. д. утилита gpu очень низка между 10%-30%.
Что касается скорости обучения, то она примерно такая же, намного быстрее, чем при использовании только ЦП.
Мне просто интересно, как это происходит.