Комментировать

CUDA + Blas

Возникла доволно банальная идея, однако про ее реализацию пока ничего не нашел. Может кто уже встречался с этим.
Идея в следующем - берем обычную библиотеку BLAS, которая используется многими разными научными программами для расчетов. Делаем оболочку и вместо функций из BLAS вызываем функции из CuBlas. В итоге получаем выигрышь в производительности (не будем пока обращать внимание на задачи с малой размерностью) без перекомпилирования самих программ(если Blas динамически подгружалась), исходников к которым может уже и нет.
Или я что-то не понимаю?

Forums: