С какой всё-таки точностью вычисляют современные GPU? Мне для задач требуется двойная точность, реализовано ли это? Спасибо.
Двойная точность вычислений
[x]
Вход
Amazon
AMD
ATI
brute force
bruteforce
cloud
CUDA
GPGPU
gpgpu.ru
GPU Gems
Intel
Larrabee
Linpack
MapReduce
MD5 crack
Nexus
NVidia
NVidia 8800
NVidia CUDA
NVidia G200
NVidia GTX280
NVidia Nexus
OpenCL
Parallel Nsight
signal processing
sparse matrices
Stream SDK
VISPL
VMWare
web
ВМиК МГУ
МГУ
Москва
Т-Платформы
Физфак МГУ
бенчмарки
блогосфера
вычисления
конкурсы
курсы
новости сайта
обработка изображений
подбор паролей
поиск
программирование GPU
работа
разное
сортировка
фильтрация трафика
численные методы
Navigation
Cвежие комментарии
-
4 days 2 hours ago
-
5 days 45 min ago
-
5 days 46 min ago
-
5 days 47 min ago
-
5 days 49 min ago
-
5 days 1 hour ago
-
5 days 2 hours ago
-
1 week 21 hours ago
-
3 weeks 6 hours ago
-
3 weeks 2 days ago
Новое на форуме
Популярно
- Как начать с самого начала работу с CUDA (33,708)
- Форумы NVidia CUDA: обзор за май (31,743)
- GPGPU и видеокарты AMD (18,148)
- NVidia GTX 280, Tesla T10P (15,738)
- SGEMM на видеокарте и CPU, серия 6 (14,881)
Comments
Рекомендуется использовать по возможности mixed-precision схемы вычислений. У НВидиа double сделан скорее для того, чтобы программисты отстали от компании с просьбами ввести double, т.к. 2ная точность работает в 10 раз медленнее 1нарной. У АМД скорость падает в 4 раза.
Ага, понятно. А не планируется полноценная реализация double? И ещё... я в основном начитался про CUDA... у АМД всё так же или есть существенные различия? Как-то я пытался разобраться в этом вопросе, но безуспешно...
если я ничего ен путаю, то в Fermi-ядрах будет именно полноценное 64, каждое ядро сможет работать в двойной точности без потери скорости.
С половиной скорости, как я понимаю (если мерять в операциях в секунду).
Как и привычные нам интеловские процессоры
Все же думаю что в 4 раза медленей :-). Операция над double занимать будит 2 такта а с флоатом пол такта.
см обсуждение
http://www.gpgpu.ru/node/128
По новой информации о Fermi:
float - 1такт
double - 2 такта
источник: http://www.ixbt.com/news/all/index.shtml?12/46/03
Это не новая информация, а примерно та же старая, времен анонса
Ну с тех пор поступили уточнения, например ядер будет 448, а не 512
Скорее всего, производительности на так эти уточнения не коснутся, но там очевидно есть проблемы с производством-выходом годных-whatever, пока живого оборудования не будет - лучше не загадывать....
В принципе, если использовать Brook+ то сам процесс программирования карт АМД становится подобен программированию карт НВидиа, тем не менее устройство карт необходимо представлять себе, и понимать что она может, а что нет.
У AMD - существенные различия, все другое.
Однако OpenCL, который имеет шанс стать многоплатформенным в этом году (пока щупаемые шевеления только у NVidia, но деваться AMD/Intel некуда) - отличия типа нивелирует. И будет все очень похоже на CUDA.
double, но гораздо медленнее считает, чем для float.
Пишут, кстати, что на AMD - не гораздо