CUDA error в вызове функции

Здравствуйте. При написании простенькой программки столкнулся с неизвестной мне ошибкой. В программировании в общем и Cuda C новичок, поэтому очень прошу Вашей помощи. Пишу в Visual Studio 2010, Toolkit 5.0(поставил последнюю версию с сайта nvidia.com, там был один 1 Гб файл). Интеграция в студию прошла успешно, примеры SDK запускаются. Однако настрожавает, что они работают, при этом в Error list есть ошибки: не знает переменных blockDim.x , gridDim.x, blockIdx.x, threadIdx.x. К тому же не понимает конструкции типа: ComplexPointwiseMA<<>>(mas1_, mas2_, mastmp_); (подчеркивает тройные скобки).
Задача, которую пытаюсь решить звучит следующим образом: есть массивы данных. В самом простом случае это двумерный массив с комплексными числами(реализован одномерным массивом mas1 размернойстью 384*8192) и одномерный массив комплексных коэффициентов(mas2 размерностью 384). Нужно умножить каждый элемент mas1 на элемент mas2 таким образом, что набору элементов из mas1(8192) соответствует один элемент из 384 mas2.
Затем полученный после умножения массив необходимо сложить так, чтобы он стал одномерным размером 8192(складываем между собой все 384 выборки по 8192 элемента). Все. Крайне примитивно, однако у меня не получается(((

Текст ошибки:
xe: Microsoft C++ exception: cudaError at memory location 0x0012f568..
First-chance exception at 0x7568b760 in nv_complex_mul_and_add.exe: Microsoft C++ exception: [rethrow] at memory location 0x00000000..
D:/work/nv_complex_mul_and_add/nv_complex_mul_and_add/kernel.cu(121) : cutilCheckMsg() CUTIL CUDA error : Kernel execution failed [ ComplexPointwiseMA ] : (9) invalid configuration argument.
The thread 'Win32 Thread' (0x43c) has exited with code -1 (0xffffffff).
The thread 'Win32 Thread' (0xbec) has exited with code -1 (0xffffffff).
The program '[2608] nv_complex_mul_and_add.exe: Native' has exited with code -1 (0xffffffff).

Текст программы в приложенном файле.

AttachmentSize
Plain text icon prog.txt3.96 KB

Forums: