Комментировать

Насколько я знаю, GT200 не

Насколько я знаю, GT200 не может выполнять ADD на SFU, хотя может выполнять MUL. Смотри например главу "Improved Dual Issue" в "NVIDIA GeForce GTX 200 Architectural Overview" по ссылке: http://www.nvidia.com/object/io_1213615494642.html. Цитирую: "The individual streaming processing cores of GeForce GTX 200 GPUs can now perform near full-speed dual-issue of multiply-add operations (MADs) and MULs (3 flops/SP) by using the SP s MAD unit to perform a MUL and ADD per clock, and using the SFU to perform another MUL in the same clock." Мне нравится выражение "near full-speed".

Касательно разреженных матриц. Не так давно, NVIDIA выпустила умножение разреженной матрицы на вектор (SpMV), см. http://forums.nvidia.com/index.php?showtopic=83825.