Здравствуйте. Начал изучать CUDA. Прочел пару книг, но ясность, как бывает, не наступила. Вопрос может показаться тупым. Какое реальное количество процессов, которые могут работать параллельно? Даже не так... К примеру у меня GTX460, объясните на пальцах, какое количество пар чисел я смогу складывать одновременно?
Thread/blocks и т.п.
[x]
Вход
Amazon
AMD
ATI
brute force
bruteforce
cloud
CUDA
GPGPU
gpgpu.ru
GPU Gems
Intel
Larrabee
Linpack
MapReduce
MD5 crack
Nexus
NVidia
NVidia 8800
NVidia CUDA
NVidia G200
NVidia GTX280
NVidia Nexus
OpenCL
Parallel Nsight
signal processing
sparse matrices
Stream SDK
VISPL
VMWare
web
ВМиК МГУ
МГУ
Москва
Т-Платформы
Физфак МГУ
бенчмарки
блогосфера
вычисления
конкурсы
курсы
новости сайта
обработка изображений
подбор паролей
поиск
программирование GPU
работа
разное
сортировка
фильтрация трафика
численные методы
Navigation
Cвежие комментарии
-
1 day 21 hours ago
-
4 days 14 hours ago
-
2 weeks 2 days ago
-
3 weeks 1 day ago
-
4 weeks 11 hours ago
-
4 weeks 2 days ago
-
5 weeks 20 hours ago
-
5 weeks 1 day ago
-
6 weeks 9 hours ago
-
6 weeks 1 day ago
Новое на форуме
Популярно
- Как начать с самого начала работу с CUDA (37,339)
- Форумы NVidia CUDA: обзор за май (34,203)
- GPGPU и видеокарты AMD (19,178)
- NVidia GTX 280, Tesla T10P (16,466)
- SGEMM на видеокарте и CPU, серия 6 (15,542)
Comments
Процесс (kernel) - в первом приближении один (во втором - на Fermi можно несколько kernels одновременно пускать, единица гранулярности - мультипроцессор).
"Одновременных сложений" - по числу Cuda cores, 336 на обычных GTX460 и 288 на SE.
А что тогда значит следующее высказывание:
"Также GPU содержит ряд потоковых мультипроцессоров, каждый из которых способен одновременно выполнять 768 (1024 - для более поздних моделей) нитей. При этом количество потоковых мультипроцессоров зависит от модели GPU. Так, GTX 280 содержит 30 потоковых мультпроцессоров..."?
То и значит.
30 мультипроцессоров, по 8 SP в каждом. Каждый SP может исполнять, действительно, 768 threads, но одновременно (в SIMD-понимании) - только 16 из них, за два такта.