[x]
Вход
Navigation
Cвежие комментарии
-
1 hour 3 min ago
-
19 hours 41 min ago
-
19 hours 43 min ago
-
19 hours 44 min ago
-
20 hours 41 sec ago
-
20 hours 18 min ago
-
1 day 6 hours ago
-
2 days 1 hour ago
-
2 days 9 hours ago
-
2 days 20 hours ago
Новое на форуме
Популярно
- Форумы NVidia CUDA: обзор за май (11,609)
- GPGPU и видеокарты AMD (8,779)
- NVidia GTX 280, Tesla T10P (8,517)
- Как начать с самого начала работу с CUDA (7,821)
- SGEMM на видеокарте и CPU, серия 6 (7,575)
Популярно сегодня
Форум Охотников - охота на глухаря . Рыбаки, Охотники и Туристы.
Да я просто не уловил возможную связь настройки директорий (добалвения в path atiocl) с падениями на вызове любой функции... Может дадите линк на что-нибудь типа "настройка opencl для нубов"...
Каких подключений?
Система какая?
Под Windows есть QueryPerformanceCounter, под Linux такое же можно ассемблерной вставкой сделать если хочется (ну и gettimeofday() формально дает микросекундное разрешение).
Но с измерением коротких интервалов надо быть *крайне* аккуратным, там есть масса подводных камней, лучше их просто не мерять (точнее, время то вы померяете с точностью до частоты процессора, но вот выводы из этого делать нужно осторожно).
Добавил(также инклуды и либы), это ничего не изменило.... А возможно такое поведение из-за отсутсвие подключений?
stream SDK кладет atiocl.dll в program files\ATI Stream\bin\x86
Этот каталог должен быть в %PATH%
драйвера 10.2.
что значит в пути? можно немного подробнее, или линк...
atiocl.dll в пути?
Драйвера версии 10.2 ?
Можно обойтись без VC++, но не без его компилятора (cl.exe).
я использую :
Перед событием ставим
а после события ставим
и затем передаем их в функцию.
Точность до миллисекунды (или 10 миллисекунд, не помню точно). На глаз так вроде верно меряет.
п.с. этов виндоуз конечно.
Помогите пожалуйста.
Решил что-нибудь попробовать, скачал и установил с сайта ати с примерами, так при запуске примеров из среды (VS2008) на вызове любой функции (например clGetPlatformIDs) происходит access violation... Что бы это значило? ведь, насколько я понял, никаких доп. манипуляций при установке совершать не нужно? Нигде ничего подобного не видел... Возможно у меня косяк с дровами для ати4570моб? У меня установлена не мобильная версия, т.к. под мобильную openCL вообще не хочет работать(сообщает при установке), хотя в списке поддерживаемых карточка числится.
Я только за :-)
С удовольствием бы пошел, но к сожалению живу не в Москве(
у меня эта проблема решилась переустановкой sdk и toolkit. + и драйвер обновлённый: 196ой
Уважаемый, Вы узнали в чём проблема?
Да, а собственно содержательные openCL-ные вызовы находятся в nvcuda.dll (в случае NVidia). opencl.dll - это только роутер (ну и всякие getPlatformIDs - тоже там).
Ок, теперь понял. Спасибо!
Ну у меня SDK/Toolkit - 3.0beta. В 2.3 нету OpenCL, насколько я помню (могу путать). Там в одном флаконе все нужное для OpenCL, CUDA и DX11 (DirectCompute)
Но Opencl.dll - идет с драйверами ((и компилятор OpenCL который часть драйвера - тоже), не с toolkit. А приложения CUDA 2.3 с новыми драйверами тоже (естественно) работают.
Кроме того, никто вообще не мешает собирать OpenCL-приложения с помощью AMD-шной opencl.lib - и они будут работать под NVidia драйверами (+- interoperability с OpenGL/DX).
Спасибо, но я стал понимать еще меньше.
Я так понимаю, что либо CUDA 2.3, либо OpenCL?
Либо Cuda 3.0 beta + OpenCL?
Последние WHQL - 196.21 (по меньшей мере для Win7, а других виндов у меня нету).
С ними все нормально. С драйверами "для Nexus" (195.62) - все уже достаточно странно. Более старые я и не пытался смотреть.
Какие именно драйвера надо поставить на NVidia картах? При установке nvdrivers_2.3-winvista_64_190.89_general у меня слетает wallpaper с рабочего стола и перестают запускаться cuda-программы, заявляя что нет устройств, поддерживающих CUDA. OpenCL код тоже не работает, вылетает при попытке выделить память, хотя и определяет все OpenCL-совместимые устройства.
NVIdia и ATI в одной машине уживаются нормально, я про это написал вчера: http://www.gpgpu.ru/node/184
Точнее, уживаются нормально если у вас два монитора, по одному к видеокарте.
Если монитор один, то дело хуже, придется перетыкать монитор, кроме того "пошаговая отладка" (Nexus) в такой ситуации не может быть использована.
Вот лично я бы ориентировался бы на NVidia + OpenCL + гибридная схема (решение в single, уточнение в double, это в любом случае быстрее на любой архитектуре), а если бы осталось время (если защита летом, то скорее всего не останется) то исследовал бы оптимальные параметры и на карте ATI (они скорее всего будут другими, чем на NVidia).
Спасибо за развёрнутый ответ.
По поводу CuBLAS, для диплома я хочу разработать свой решатель(надеюсь хватит времени), и к тому же линейными системами не собираюсь ограничиваться.
По поводу уточнения single до double. Тоже над этим думал, тем более это хорошо подходит к итерационным методам.. но, для того, чтобы выбрать что эффективнее(например только ati+double или nvidia с уточнением, и т.д.) нужно делать тесты...
Думаю скорей всего буду использовать OpenCL. Но вот дилемма Ati или NVidia..
Ati на двойной точности быстрее.. А NVidia как я понял обладает более лучшем SDK(?), и вроде CUDA очень похожа на OpenCL, что даёт большой плюс.
Сначала я думал взять видеокарты обоих производителей и сравнить, но как я понял в одном компьютере они плохо уживаются.. постоянно перетыкивать не очень хочется..
Средства пошаговой отладки это конечно хорошо, но всегда можно и без них обойтись, правда это суждение основано только на опыте программирования приложений не для GPU.
В общем, пока в раздумьях.
Но ситуация облегчается тем, что видеокарту можно отнести обратно в магазин, без сильной потери стоимости и купить другую..
спасибо :) постараюсь понять теперь что дальше с этим делать :)
Исходники выкладывали для первой версии, не самой быстрой.
Возьмите лучше за основу Волковский my Speedy FFT:
http://forums.nvidia.com/index.php?showtopic=69801
А так и должно быть, оказывается:
http://developer.amd.com/support/KnowledgeBase/Lists/KnowledgeBase/DispF...
Double-precision floating point built-in function support will be added in a future release.
То есть или stream (а не OpenCL), или идти к начальству и требовать NVidia (т.е. реально ждать ферми) или ждать пока ATI это место починит.