Для тех, кому лень следить за gpgpu.org две тщательно отобранных ссылки, показавшихся мне интересными (остальные полтора десятка свежих материалов - не зацепили)
- GPU VSIPL is an implementation of Vector Signal Image Processing Library
- VISPL - это стандартная библиотека обработки векторов-изображений-сигналов (в первый раз про нее слышу, если честно). Линейная алгебра, FFT, convolution и так далее (VISPL 1.3 API (PDF)).
GPU-VISPL - это реализация того же самого для NVidia CUDA, обещают ускорение на порядки. Есть дистрибутив, берешь, ставишь, линкуешся, PROFIT! - Designing Efficient Sorting Algorithms for Manycore GPUs (PDF)
- Довольно полезная статья по сортировку, с результатами, рвут CPU на части (но не на порядки, а в разы), рекомендую.
Comments
GTX280 у них всего до полутора раз быстрее чем интеловский четырёх-ядерник? Ха-ха :)))
Я может как-то неправильно интерпретировал, но radix - вчетверо быстрее 8-ядерника. Что мне кажется похожим на правду.
Я имею в виду Fig.8b где они сравнивают с результатами из аналогичной публикации от Интела, а именно Chhugani et al. Efficient implementation of sorting on multi-core SIMD CPU architecture, VLDB 08.
На Fig.8a идёт сравнение с несколько устаревшей реализацией в Intel TBB и парой их собственных реализаций для CPU, что, на мой взгляд, не так интересно.