[x]
Вход
Amazon
AMD
ATI
brute force
bruteforce
cloud
CUDA
GPGPU
gpgpu.ru
GPU Gems
Intel
Larrabee
Linpack
MapReduce
MD5 crack
Nexus
NVidia
NVidia 8800
NVidia CUDA
NVidia G200
NVidia GTX280
NVidia Nexus
OpenCL
Parallel Nsight
signal processing
sparse matrices
Stream SDK
VISPL
VMWare
web
ВМиК МГУ
МГУ
Москва
Т-Платформы
Физфак МГУ
бенчмарки
блогосфера
вычисления
конкурсы
курсы
новости сайта
обработка изображений
подбор паролей
поиск
программирование GPU
работа
разное
сортировка
фильтрация трафика
численные методы
Navigation
Cвежие комментарии
-
1 day 17 hours ago
-
4 days 11 hours ago
-
2 weeks 2 days ago
-
3 weeks 1 day ago
-
4 weeks 8 hours ago
-
4 weeks 2 days ago
-
5 weeks 16 hours ago
-
5 weeks 1 day ago
-
6 weeks 5 hours ago
-
6 weeks 1 day ago
Новое на форуме
Популярно
- Как начать с самого начала работу с CUDA (37,331)
- Форумы NVidia CUDA: обзор за май (34,195)
- GPGPU и видеокарты AMD (19,177)
- NVidia GTX 280, Tesla T10P (16,464)
- SGEMM на видеокарте и CPU, серия 6 (15,541)
Немного потестил - сходимость такая же, как и была на предыдущей whql. Цифирки(норма вектора невязки) совпадают полностью(все значащие цифры в double), что намекает на то, что вычисления остались такими же(по результату), если были бы другие - через 15k итераций наверняка бы проявилась разница. Количество итераций такое же.
Ускорение GFlops на SPMV 1.11
Ускорение итераций 1.09
Ускорение ПСП (на ядре DAEqB, http://www.gpgpu.ru/node/180#comment-1507) 1.03
Судя по значительно ускорившемуся GFlops на SPMV, для которого главное сейчас ПСП, и незначительно ускорившемуся ПСП, double вычисления стали ощутимо быстрее(я думаю >10%). Ядер для bogoFlops не делал..
Приятно получить такой бонус ничего не делая, конечно заново строить графики в пояснялке не буду - не успею..