Thread/blocks и т.п.

Tagged:  

Здравствуйте. Начал изучать CUDA. Прочел пару книг, но ясность, как бывает, не наступила. Вопрос может показаться тупым. Какое реальное количество процессов, которые могут работать параллельно? Даже не так... К примеру у меня GTX460, объясните на пальцах, какое количество пар чисел я смогу складывать одновременно?

Comments

Процесс (kernel) - в первом приближении один (во втором - на Fermi можно несколько kernels одновременно пускать, единица гранулярности - мультипроцессор).

"Одновременных сложений" - по числу Cuda cores, 336 на обычных GTX460 и 288 на SE.

А что тогда значит следующее высказывание:

"Также GPU содержит ряд потоковых мультипроцессоров, каждый из которых способен одновременно выполнять 768 (1024 - для более поздних моделей) нитей. При этом количество потоковых мультипроцессоров зависит от модели GPU. Так, GTX 280 содержит 30 потоковых мультпроцессоров..."?

То и значит.
30 мультипроцессоров, по 8 SP в каждом. Каждый SP может исполнять, действительно, 768 threads, но одновременно (в SIMD-понимании) - только 16 из них, за два такта.

Copyright © 2008-2011 Alex Tutubalin