Комментировать

Написал маленький тест на

Написал маленький тест на SGEMM. 10 расчетов за раз. Вся работа с кудой вынесена в отдельную стат.библиотеку. Получил следующие результаты:

  1. Size: 10
  2. Elapsed time CPU: 0.000003 sec
  3. Elapsed time GPU: 0.000249 sec
  4. Size: 35
  5. Elapsed time CPU: 0.000067 sec
  6. Elapsed time GPU: 0.000248 sec
  7. Size: 60
  8. Elapsed time CPU: 0.000305 sec
  9. Elapsed time GPU: 0.000272 sec
  10. Size: 85
  11. Elapsed time CPU: 0.000831 sec
  12. Elapsed time GPU: 0.000349 sec
  13. Size: 110
  14. Elapsed time CPU: 0.001744 sec
  15. Elapsed time GPU: 0.000432 sec

Так что результат есть. Для 985 элементов 1.41 против 0.02.
Единственное что беспокоит, у blas'ой функции есть возможность выбора способа хранения матриц. У куды такого не нашел. Ну чтож, для таких случаев можно будет и cpu задействовать. Ну или перевести туда-сюда.