Thread/blocks и т.п.

Здравствуйте. Начал изучать CUDA. Прочел пару книг, но ясность, как бывает, не наступила. Вопрос может показаться тупым. Какое реальное количество процессов, которые могут работать параллельно? Даже не так... К примеру у меня GTX460, объясните на пальцах, какое количество пар чисел я смогу складывать одновременно?

Forums: 

Процесс (kernel) - в первом

Процесс (kernel) - в первом приближении один (во втором - на Fermi можно несколько kernels одновременно пускать, единица гранулярности - мультипроцессор).

"Одновременных сложений" - по числу Cuda cores, 336 на обычных GTX460 и 288 на SE.

Нити

А что тогда значит следующее высказывание:

"Также GPU содержит ряд потоковых мультипроцессоров, каждый из которых способен одновременно выполнять 768 (1024 - для более поздних моделей) нитей. При этом количество потоковых мультипроцессоров зависит от модели GPU. Так, GTX 280 содержит 30 потоковых мультпроцессоров..."?

То и значит. 30

То и значит.
30 мультипроцессоров, по 8 SP в каждом. Каждый SP может исполнять, действительно, 768 threads, но одновременно (в SIMD-понимании) - только 16 из них, за два такта.