NVidia CUDA

CUDA 3.0 Beta

24 ноября стал публично доступен CUDA Toolkit 3.0 Beta.

Все ссылки на скачивание в теме форума NVidia, их много, не вижу смысла тут дублировать.

К сожалению, в документации обновился только Reference Manual (и он же теперь есть online), вся остальная документация несет на себе гордую надпись Version 2.3.

Для работы нужен драйвер 195-й серии (195.62 уже не бета, по меньшей мере для Windows, от клиентов можно требовать апгрейда).

Cписок новых фич, кратко (более полный список - в Release Notes):

CUDA 2.2

CUDA 2.2 уже несколько дней как в релизе.

Действительно серьезное изменение одно:

GPU может мэпировать pinned memory в свое адресное пространство.

Для "интегрированных карт", которые на самом деле используют общую с CPU память - это просто избавление от избыточной пересылки данных. С учетом того, что на ноутбучных картах производительность и так не очень - полезное подспорье.

LAPACK на CUDA

Василий Волков с соавторами продолжают радовать нас быстрым кодом для всяких полезных вычислений.

На Core2Quad + GTX280 получается примерно в 5 раз быстрее, чем просто на процессоре, что есть весьма достойно.

CUDA 2.1

Вышла NVidia CUDA 2.1 (релиз). На официальном сайте пока нет, все ссылки для скачивания лежат в форуме по CUDA, обсуждать предлагается в отдельном треде, но обсуждение пока не очень интересное.

Анонс: Использование графических процессоров и технологии CUDA для задач молекулярной динамики

В журнале Вычислительные методы и программирование вышла статья А.С Боярченкова и С.И Поташникова: Использование графических процессоров и технологии CUDA для задач молекулярной динамики. Вот ее аннотация (полные тексты доступны по ссылке):

Рассмотрена параллельная реализация расчета парных межчастичных взаимодействий в методе молекулярной динамики при нулевых граничных условиях на графических процессорах с применением платформы NVIDIA CUDA. Впервые предложена эффективная реализация с использованием третьего закона Ньютона на основе технологии CUDA. Предложены приемы оптимизации кода. На видеокарте NVIDIA GeForce 8800 GTX по сравнению со скалярной версией на процессоре AMD Athlon64 2.1 ГГц достигнуто ускорение до 660 раз для системы из 49152 частиц.

Bruteforce и жизнь

Тот факт, что любой перебор очень легко параллелится, что на GPU, что просто на компьютерах, объединенных интернетом, породило множество "переборных" задач, от rc5crack до Folding@Home. Обмен данными между нодами почти не нужен, задания и результаты - компактные, ляпота.

Есть такой программный продукт pyrit: Advances in attacking WPA-PSK. Хостится, как легко видеть, на Google Code и никого это не смущает.

SGEMM/DGEMM на видеокарте и CPU, серия 7: NVidia GTX280

Как я уже писал в прошлый раз, становится какой-то дурной традицией переделывать тест умножения матриц каждые несколько месяцев.

В этот раз причиной для тестов стало появление у меня в доступности видеокарты NVidia GTX280, что позволило протестировать два момента:

  • Производительность умножения матриц с одинарной точностью (SGEMM) на новом быстром оборудовании.
  • Производительность умножения матриц с двойной точностью (DGEMM).
И сравнить результаты с mainstream-поколением процессоров Intel (Penryn), к сожалению i7 в доступности у меня пока нет.

CUDA: внешнее прекращение работы kernel

Многие спрашивают - а как прекратить выполнение CUDA kernel.

Эта тема много раз всплывала на форумах по CUDA но внятного ответа я до сегодняшнего дня не видел. Однако сегодня увидел ответ от представителя NVidia:

CUDA 2.1 beta

Вышла NVidia CUDA 2.1 BETA.

Из заметных изменений:

  • Поддержка компиляции .PTX-кода на лету (драйвером)
  • Поддержка TESLA на Висте
  • Расширено взаимодействие с Direct3D
  • Поддержан Microsoft Visual C++ 9 (VS2008)

Скачать можно откуда обычно: Get CUDA, для скачивания предлагаются драйвер и CUDA Toolkit, судя по всему SDK пока не обновлен.

Сетевой анализатор на CUDA

продолжаем перепубликацию с GPGPU.ORG

Gnort: High Performance Network Intrusion Detection Using Graphics Processors: модифицированный Snort, обработка паттернов делается на GPU (NVidia/CUDA).

Syndicate content
Copyright © 2008-2009 Alex Tutubalin