необходима помощь

привет всем!
хотел поинтересоваться у народа почему моя прога не пашет как надо.
задача наипростейшая:
есть двухмерный массив и аррэй.
1) надо сложить аррэй с каждым рядом массива.
2) сложить каждый элемент ряда в массиве и выкинуть его в аррэй.

итак, первая под-задача у меня реализована и исполняется в 3 раза быстрее чем на цпу.
код первого кернела (1) по линке ниже (работает с любыми измерениями массива и шустро)

http://www.gpgpu.ru/node/877

код второго (не правильно работает при больших массивах и вообще медленный но по-моему правильно написанный):

http://www.gpgpu.ru/node/878

Forums: