Делимся опытом

Кто для каких приложений применял видеокарты ?
Каков был эффект ? Делимся не стесняемся !
Кто что для себя подметил в результате своей работы ?
Мой опыт небольшой : несколько простых кернелов для распространения сигнала и обратного распространения ошибки в нейросети. CPU версия была написана на C# поэтому боюсь сравнение будет не коректным, да и алгоритмы малость отличаются. Но как-то выложу.
Компиляция моего личного опыта с прочитаным сдесь - http://justanotherblog565.blogspot.com/2009/01/gpgpu_14.html.

Forums: 

По разному писал простенький

По разному писал простенький брутфорсер МД5.
Конечный эффект хороший - 98% загруженности видяхи по тактам. 330млн хэш/сек.
Потоков должно быть много, даже если кажется, что их достаточно. Для АМД лучше всего наверное при времени выполнения кернела в 200мс 32*16*Number_of_SIMD потоков

RAR брутфорсер

Как определить, что конкретный пароль верный?
Надо ли для этого распаковывать весь файл, или это делается очень-очень просто?
Т.е. может где-то в начале файле есть какое-то контрольное поле?

задачи

1. генерация случайных чисел различными генераторами (LCG, MT)
3600 миллионов чисел/сек на GeForce 8800GTS
8000 миллионов чисел/сек на GTX 280
2. клеточные автоматы, разностные схемы (двумерные)
3000 - 5000 миллионов клеток/узлов в секунду
3. многомерное интегрирование

Monte-Carlo симуляции на GPUs

http://arxiv.org/abs/0903.3053
прогоняли две решеточные модели ( програмили на ATI IL). Для модели Изинга получился выигрыш примерно в 50 раз (CPU E6550@2.33GHz ). C LDS были проблемы, прога работала нестабильно, поэтому reduction делал через глобальный буфер (использовали ATI Stream v. 1.3 бета). Были и курьезы:)
Например, одна из ранних версий моей проги работала стабильно только при активации скринсейвера...

P.S.: могу выслать, если кому интересно (e-mail указан непосредственно в статье)