Выбор видеокарты для вычислений на CUDA

на сколько процентов будет прирост у GTX460 по сравнению с GTS250 в бенчмарках с уклоном на вычисления, например FluidMark ?
(например модели:
http://www.msi.com/index.php?func=proddesc&maincat_no=130&cat2_no=663&pr...
http://www.msi.com/index.php?func=proddesc&maincat_no=130&cat2_no=738&pr...)

P.S.
собсна хочу купить одну из них и уже весь мозг сломал над выбором, если там на вычислительных задачах прирост будет порядка 20% то GTS250, а если в хотя бы .. ну незнаю в 2 раза то надо GTX460 ...

http://en.wikipedia.org/wiki/Comparison_of_Nvidia_graphics_processing_un...
Wiki говорит что прирост производительности будет только на 29% (с 700ГФп до 900ГФп)

http://www.nvidia.com/object/IO_89570.html
NVidia заявляет что прирост производительности рассчётов должен быть аж в 4 раза (в разделе Designed for Double Precision)(правда там сравнение идёт с чипом GT200, но у GTS250 чип вообще GF92b так что я предполагаю что он еще хуже справляться должен)

http://www.nvidia.com/object/IO_89569.html
NVidia и вновь заявления о том что новая архитектура должна в 4,3-4,6 раз лучше работать с численными расчётами (раздел Smoothed Particle Hydrodynamics)

а мне какраз для математических вычислений надо ! (и в часности для моделирования жидкости)
НО здесь везде идёт просто сравнение архитектур, а не конкретных карточек, т.е. можно трактовать так: топовые карточки серии 4хх должны считать в 4 раза лучше чем карточка аля GTX260 - в чём собственно и нет секрета, т.к. ну вот например выбранная GTX260 даже по данным вики просто по производительности в 2 раза меньше чем GTX480, .. но уже GTX285 уступает лишь на 26% (опять таки это из данных wiki)
И вот непонятно, либо верить Nvidia и надеяться на значительный прирост, ... либо это их рекламный ход для поднятия продаж топовых карточек
...хотя кэш у процов, единое адресное пространство для разных видов памяти и спец заточенная IDE ... поидее должны радовать...

P.P.S.
http://www.overclockers.ru/lab/38798_3/GeForce_GTX_460_1_Gbajt_protiv_st...
Обзор от overclockers.ru: в бенчмарке FluidMark, GTX460 показала прирост в 60-67% над GT9800, а т.к. GTS250 построена на том же ядре (и по многим параметрам похожа), то можно очень грубо сказать что вот он ответ на мой вопрос, прирост производительности GTX460 над GTS250, но ... можно ли ? приравнять производительность карт GT9800 и GTS250 ... ?

Forums: 

Насколько я понимаю: У

Насколько я понимаю:
У GTX460 в 2.6 раза больше ядер
но несколько меньше частота
разница по bandwidth памяти для 768-мегабайтной модели не очень большая, для гигабайтной - больше чем в полтора раза.

Т.е. я бы ожидал прироста минимум в полтора раза (для задач, упертых в bandwidth) и больше (для задач, упертых в процессор).

Quadro 4000 для GPGPU

lexa,
а как себя будут вести карты Quadro в приложениях GPGPU ?
есть ли смысл брать Quadro 4000 для задач цифровой обработки данных, например, КИХ-фильров, FFT, алгоритмов Витерби, в задачах поиска и сортировки данных ?
или может достаточно GFX 480/580, которые по цене сильно (~в 2 раза) ниже ?

Смысл в квадре (или тесле)

Смысл в квадре (или тесле) есть, если нужна быстрая двойная точность, либо больше памяти (чем в игровых картах)

спасибо, понятно учитывая,

спасибо, понятно
учитывая, что производители скоро обещают 3Гб на борту GTX, то тратиться на кварду смысла нет

Если не интересует

Если не интересует производительность с двойной точностью - то так и есть.
А двойная точность - зарезана по производительности у 4xx/5xx, именно из тех соображений, чтобы расчетчики не покупали игровые карты.

Это если не трогать OpenGL и производительность в Adobe Premiere и подобных, где блистает квадра, но софтверное ли это ограничение или же реально аппаратное - мне доподлинно неизвестно.

lexa

задумался над выбором GTX480 vs GTX570
по производительности 570 немного лучше, но памяти меньше на 300Мб
сомневаюсь в эффективности по сравнению с ЦП (i7-920 4GHz)

планирую считать 2-х мерную корреляцию на небольших матрицах, ориентировочно 512х1024
входных данных почти не будет (скользящее окно)
в даблах, значения комплексные
результаты писать в основную память

что посоветуете

Вы все правильно пишете про

Вы все правильно пишете про производительность и память.

Что же до эффективности, то я сходу не могу сообразить вычислительную сложность (корреляцией не занимался с 80-х годов, все вообще забыл), речь идет о, по сути, попарных сравнениях? Т.е. линейное по количеству данных?
Тогда смысла в видеокарте скорее всего нет.

нет, попарное сравнение - это

нет, попарное сравнение - это ковариация

корреляция : 1) поэлементное перемножение матриц с последующим сложением всех элементов - получение элемента (m,n) 2) удаление первой строки (столбца) и дописывание последней строки(столбца) 3) повторение пункта 1

есть более быстрый способ: 1)взять FFT2 от обеих матриц 2) перемножить 3) взять IFFT2 от результата

Более быстрый способ,

Более быстрый способ, очевидно, имеет смысл на видеокарте.

Причем, попробовать можно прямо вот с помощью CUFFT, не программируя особо.