[x]
Вход
.NET
AMD
ATI
BLAS
bruteforce
brute force
CUDA
GPGPU
gpgpu.ru
GPU Gems
Larrabee
MapReduce
MD5 crack
N-body
Nexus
NVidia
NVidia 8800
NVidia CUDA
NVidia G200
NVidia GTX280
NVidia Nexus
NVidia Tesla
OpenCL
search
signal processing
Sort
sparse matrices
Stream SDK
VISPL
VMWare
web
ВМиК МГУ
Москва
администрирование сайта
бенчмарки
блогосфера
вычисления
конкурсы
курсы
новости сайта
обработка изображений
подбор паролей
поиск
презентации
программирование GPU
работа
разное
сортировка
фильтрация трафика
численные методы
Navigation
Cвежие комментарии
-
1 week 5 hours ago
-
4 weeks 2 days ago
-
6 weeks 15 hours ago
-
7 weeks 5 days ago
-
9 weeks 2 days ago
-
9 weeks 3 days ago
-
9 weeks 3 days ago
-
9 weeks 3 days ago
-
9 weeks 6 days ago
-
10 weeks 4 days ago
Новое на форуме
Популярно
- Форумы NVidia CUDA: обзор за май (16,682)
- Как начать с самого начала работу с CUDA (14,372)
- GPGPU и видеокарты AMD (11,877)
- NVidia GTX 280, Tesla T10P (10,585)
- SGEMM на видеокарте и CPU, серия 6 (10,310)
Вот к примеру два жестких диска - у одного transfer вдвое быстрее, а у другого - seek. Какой "быстрее" ? Не зная задачи, выбрать невозможно, для streaming оптимален один, для базы данных - другой.
И это вообще проблема бенчмарок. Ну вот прогнали gpubench, получили набор из 10 цифр для разных операций. А какая операция будет наиболее проблемной для конкретной задачи - трудно узнать.
В этом смысле SGEMM/DGEMM или FFT как вычислительные бенчмарки очень хороши - про них многое известно, накоплена большая база и т.п..
Что касается BarsWF - это тоже очень интересная метрика, но ее можно рассматривать только по модулю автора (скажем, мне тамошнее масштабирование очень удивительно и я пока сам руками не пощупаю - а исходников нет - не могу быть убежден, что там с occupancy все нормально. Правда я только версию 0.7 смотрел).