Комментировать

Я всё ещё в раздумьях (у меня

Я всё ещё в раздумьях (у меня много других дел, да и по диплому тоже есть работа над другими частями... да и с CUDA можно вообще на эмуляторе тестировать, так что пока ещё не слишком спешу.. ).
Думаю поступить следующим образом: подождать пока выйдет GTX480, даже если не куплю её, то думаю что она окажет влияние на цены предыдущий моделей.
Можно поступить ещё следующим образом, взять видеокарту попроще и отлаживать на ней. А перед дипломом обменять её на более производительную, чтобы получить хороший результат. Вот только я не вижу GTX260 в магазинах, GTS250 полно, а GTX260 нет(причём GTX280 285 есть).
Я даже думал вести разработку на CUDA, потом портировать на OpenCL(как я понял, это происходит вообще без проблем) и гонять на ATI. Вот только я что-то не вижу тестов производительности ATI(может не там ищу), очень хотелось бы узнать показатели HD5850, HD5870 хотя бы на SGEMM/DGEMM(было бы вообще хорошо узнать эти показатели для GTS250 и GTX260).

По поводу моей задачи: я собираюсь решать симметричные положительно определённые разряженные матрицы, которые приводятся к ленточному виду, так что использовать CUBLAS здесь будет не очень эффективно. Смотрел в сторону итерационных методов, которые прекрасно подходят под принцип уточнения решения(сначала float, а потом double), а именно метод сопряжённых градиентов(который прекрасно распараллеливаится, так как состоит из умножения матрицы на вектор, и вектора на вектор(скалярное произведение), и который можно оптимизировать под матрицы ленточного вида).
Только определился с методом(в идеале конечно лучше реализовать несколько), и как часто бывает нашёл в интернете, что кто-то уже занимался этим, даже есть исходный код - а именно OpenNL, в которой есть plugin CNC(который работает на Cuda). Но у меня есть ряд идей оптимизации конкретно под мою задачу.