Комментировать

По поводу sparse linear systems

По поводу sparse linear systems можно посмотреть еще по линку:
http://lattice.bu.edu/quda/ ,
и документация к нему
http://arxiv.org/abs/0911.3191.
Люди реализовали CG и BiCG алгоритмы. просто откомпилируйте и можете погонять тесты (invert_test.c, в частноти) Хотя написан пакет под конкретный вид матриц (Wilson-Dirac operator), возможно попробовать приспособить под свои задачи. По крайней мере, как пример реализации указанных алгоритмов на CUDA вполне пойдет (inv_cg_quda.cpp and inv_bicgstab_quda.cpp).
Eще мне понравился self-tuning позволяющий приложению подобрать оптимальные параметры под конкретное железо (размеры блока и тредгрида).

P.S.: да, все это написано под linux, ессно.