Комментировать

HD4850

Немного протестировал как обстоят дела с умножением матриц на HD4850(512MB Sapphire), версия SDK - 2.01, драйвера - 10-3, ОС Windows 2008R2X64, мп Asus P5Q3. тестировал OpenCL версию умножения матриц(из примеров SDK, мне кажется они CL код для матричного умножения поменяли по сравнению с 2.00 . Теперь есть два ядра - одно использует local storage, другое нет.. использовать LS или нет C++ код определяет автоматически(в случае 4850 соответственно нет). Я могу ошибаться, может это уже было в 2.00).

Размер матриц 2048x2048.

Приближённый результат для Single точности - 98GFlop/s

Для Double - 28GFlop/s
(я просто заменил в CL коде float4 на double4 и добавил
"#pragma OPENCL EXTENSION cl_khr_fp64 : enable".
в C++ коде заменил cl_float на cl_double.
Тесты прошли успешно(ключ -e))

Интересно узнать результат для 5870