Василий Волков с соавторами продолжают радовать нас быстрым кодом для всяких полезных вычислений.
- LU, QR and Cholesky factorizations using GPU - собщение в форумах NVidia, исходный код приаттачен.
- Ну а статью про это с SC08 многие наверное уже видели, но на всякий случай дам ссылку:
Volkov, V., and Demmel, J. W. 2008. Benchmarking GPUs to tune dense linear algebra, SC08.
На Core2Quad + GTX280 получается примерно в 5 раз быстрее, чем просто на процессоре, что есть весьма достойно.