[x]
Вход
Amazon
AMD
ATI
brute force
bruteforce
cloud
CUDA
GPGPU
gpgpu.ru
GPU Gems
Intel
Larrabee
Linpack
MapReduce
MD5 crack
Nexus
NVidia
NVidia 8800
NVidia CUDA
NVidia G200
NVidia GTX280
NVidia Nexus
OpenCL
Parallel Nsight
signal processing
sparse matrices
Stream SDK
VISPL
VMWare
web
ВМиК МГУ
МГУ
Москва
Т-Платформы
Физфак МГУ
бенчмарки
блогосфера
вычисления
конкурсы
курсы
новости сайта
обработка изображений
подбор паролей
поиск
программирование GPU
работа
разное
сортировка
фильтрация трафика
численные методы
Navigation
Cвежие комментарии
-
1 week 6 hours ago
-
1 week 1 day ago
-
1 week 1 day ago
-
1 week 1 day ago
-
1 week 1 day ago
-
1 week 1 day ago
-
1 week 1 day ago
-
1 week 4 days ago
-
3 weeks 3 days ago
-
3 weeks 5 days ago
Новое на форуме
Популярно
- Как начать с самого начала работу с CUDA (33,816)
- Форумы NVidia CUDA: обзор за май (31,806)
- GPGPU и видеокарты AMD (18,179)
- NVidia GTX 280, Tesla T10P (15,755)
- SGEMM на видеокарте и CPU, серия 6 (14,893)
Архитектуры чего ? Выбор архитектуры приложения понятное дело делается раньше. А вот выбор конкретной модели видеокарты (или видеокарт ?) уже вопрос которые как по мне должен решатся в рабочем порядке. Думаю не очень сложно поменять карточку после того как подобрал нужный алгоритм. Если реально нужно выполнить какую-то работу на видеокарте (читай быстро и дёшево) особенно если это не ради забавы, а ради реального приложения которое потом нужно будет устанавливать на многие машины. У меня вот возникли проблемы с видеокартами АТИ которые ставят под вопрос решение задачи - я легко поменяю brook+ на CUDA ( например работа с локальной памятью у нвидиа поудобней для программиста реализована - а значит можно её эффективнее использовать) . Помоему очевидно что для быстрого дискретного преобразования Фурье, синус и квадратный корень не очень нужен ? И в принципе известно количество операций сложения и умножения. Какая разница насколько быстро работает карточка в одном тесте с определённым соотношением инструкций, если в реальном приложении оно будет другое ? GPUBench - даёт возможность не просто пособирать циферки (цифирки - меня не интересуют))) ), а понять как в разных сценариях работает железо. ФФТ в этом плане не информативен. Любой единственнй тест, результатом которого является одно число - время выполнения, не информативен. Извините, но у меня сложилось впечатления что вы только заголовок прочитали. На сбор циферок больше похоже перемножение матриц и любые другие не микро бенчмарки.
Think Data Parallel http://justanotherblog565.blogspot.com/