8 мультипроцессоров * 32 потоковых мультипроцессоров != 384 ?

Никак не могу понять как цифры, распространяемые менеджерами Nvidia согласуются с реальной архитектурой. У меня Geforce GTX 560 Ti TOP. Отладчик дает информацию о 8 мультипроцессорах и Compute Capability 2.1. Это значит на каждый мультипроцессор приходится по 32 скалярных процессора и 4 Special Function. Да, есть 16 Load/Store-блоков, которые позволяют определить адреса данных в кеше или памяти для 16 потоков за каждый такт (то есть не процессорами не являются).

Так как получается заветное число 384, которое менедждеры Nvidia размещают на коробках?

http://ru.wikipedia.org/wiki/%D0%A1%D1%80%D0%B0%D0%B2%D0%BD%D0%B5%D0%BD%...

Forums: 

Сама Nvidia отчего-то

Сама Nvidia пишет, что в 560Ti cuda cores - 352 для OEM-версии и 384 - для Retail. Т.е. 11/12 потоковых процессоров.

А что показывает deviceQuery (пример из SDK)?

Спасибо, что подсказали этот ход!

Одна из записей гласит:
<8> Multiprocessors * <48> Cuda cores/MP 384 Cuda Cores

Я для себя решил этот вопрос так (еще пару дней назад придумал): раз ядер 384, а мультипроцессоров 8, то на 1 мультипроцессор приходится 48 ядер. Необходимо найти 2 целых числа, произведение которых равно 48, а одно из которых является степенью 2 (при нескольких вариантах необходимо выбрать с максимальной степенью 2). Следовательно 48 ядер разбиты в три группы по 16 ядер каждая (3*16=48). Это очень напоминает текстурный блок с 3 потоковыми мультипроцессорами, только имеющим по 16 ядер.

И ведь действительно, в

И ведь действительно, в Compute capability 2.1 - 48 cores на мультипроцессоре. И я ведь знал, но забыл.