Анонсы

NVidia OpenCL 1.1

Tags: 

NVidia в рассылке для девелоперов сообщает нам, что в драйверах начиная с 280.13 поддерживается OpenCL 1.1

Я пощупал драйвера 280.18 для Win7/x64, и так оно и оказалось.

Проверил все примеры из AMD APP SDK, существенная часть которых раньше не работала с NVidia т.к. требовала OpenCL 1.1. Ситуация стала лучше, хотя и не идеальной:

  • Два примера должны бы работать, но не работают по причине разницы синтаксиса:
    • FluidSimulation2D ломается c диагностикой "не могу преобразовать вектора разных размеров" на конструкции вида int8 = unsigned + int8.
    • GlobalMemoryBandwidth ломается на вызове "overloadable" функции native_divide()
  • Еще три примера ломаются т.к. NVidia не поддерживает ряд расширений (что вполне ожидаемо):
    • DeviceFission - нет соответствующего расширения (хотя на Fermi его хотелось бы иметь, аппаратура то умеет)
    • SimpleDX10 - нет интеграции с DX10
    • TransferOverlap - работает, если не попросить для памяти флаг CL_MEM_USE_PERSISTENT_MEM_AMD
Но жизнь стала лучше. Например, поддерживаются 2D-изображения 16k-x-16k, вместо совершенно бессмысленных 4k-x-32k в предыдущих драйверах.

CUDA by Example на русском

Tags: 

Нам сообщают, что вышел русский перевод книги CUDA by Example.

ISBN: 978-5-94074-504-4, 978-0-13-138768-3

Доступна в онлайн-магазинах. например в Озоне и Лабиринте.

Я (исходный) английский вариант не читал, поэтому спиратил нашел в ознакомительных целях, быстро пролистал и удалил :).

CUDA 4.0

Tags: 

NVidia анонсировала CUDA 4.0

С моей колокольни интересны две вещи:

  • GPU Direct 2.0 т.е. прямая пересылка данных между (нескольки) картами, не задействуя память (и процессор?) хоста.
  • Унифицированная адресация на GPU и на хосте. Я это понял так, что адресное пространство общее, никаких отдельных сudaMemcpy.
Рассказы про остальные фишки лично меня не впечатлили (Thrust и так уже был, MPI не волнует), но будем посмотреть вживую (начиная с 4 марта).

"Интересные фишки" тоже будем посмотреть: про GPI Direct на онлайн-конференции был задан вопрос "это только для Tesla", а в момент ответа у меня пропал звук. С унифицированной адресацией у меня есть непонимание, как на эту схему ложится асинхронная передача.

Другими словами, 4-5 марта надо ломиться на nvdeveloper и брать бету на поиграться.

Конкурс HPC-GPGPU проектов

Tags: 

Не могу не отрекламировать конкурс:

Эффективное использование GPU-ускорителей при решении больших задач

(дальше просто копированием с сайта конкурса, c его страницы и с пресс-релиза):

Конкурс будет проводиться в три этапа.

На первом этапе (до 28 февраля) участники конкурса проходят процедуру регистрации и предоставляют заявки. По итогам первого этапа будет отобрано до 30 проектов, каждому из которых будет выделено поощрительное финансирование на начальный этап проведения работ в размере 100 тысяч рублей.

На втором этапе (до 25 апреля 2011) участники должны будут предоставить отчеты по результатам пробных работ первого этапа. Подключиться к участию в конкурсе можно на любом этапе его проведения. В частности, к участию во втором этапе допускаются новые проекты, заявка по которым на первом этапе не подавалась. По окончании второго этапа экспертной комиссией будет выбрано 15 заявок и выделено финансирование в размере 200 тысяч рублей на каждую задачу.

На третьем этапе (до 30 сентября 2011) участники должны предоставить отчеты о проделанной работе в виде научно-популярной статьи. Как и на втором этапе, допускается подача заявок по новым проектам, которые не участвовали на первом и втором этапах. По окончании третьего этапа будут подведены итоги конкурса и объявлены восемь проектов, которые получат по 500 тысяч рублей каждый на продолжение своих исследований. Награждение победителей пройдет в конце ноября 2011 года на 7-й суперкомпьютерной конференции RSC 2011.

Intel: OpenCL для CPU (alpha)

Tags: 

Inel выпустил альфа-версию OpenCL для CPU.

Целиком поддерживаю это начинание. Конечно, у AMD такое уже есть полтора года как, но на Intel несколько больше надежды, что это станет стандартной частью системы или, как минимум, удобным redistributable (а не частью "драйвера видеокарты", притом не общего, а отдельной версии). А для всяких GPGPU-решений появится удобный fallback на CPU.

Amazon EC2 и GPGPU

Tags: 

Амазон прислал сегодня уведомление, дескать начали продавать виртуальные машины с GPU (NVidia Tesla).

Конфигурация инстанса, вкратце:

  • 22GB памяти
  • 33.5 EC2 Compute units (это эквивалентно примерно 8-ядерному Xeon гигагерца на 2.5-3)
  • Два ядра NVidia Tesla M2050
  • 1.6TB instance storage
  • 10G-Ethernet

Подробнее здесь

ATI Catalyst & OpenCL

Tags: 

Начиная с Catalyst 10.10, пользователям доступна расширенная версия драйверов видеокарт ATI: "Accelerated Parallel Processing (APP) Technology Edition".

Теоретически это означает, что для запуска OpenCL-кода на пользовательской машине пользователю больше не нужно качать и ставить Stream SDK.

В настоящий момент у меня ATI-карты в машине нет, но и без нее драйвер можно поставить, при этом поставится только рантайм от Stream SDK, которого достаточно для получения OpenCL на CPU. Работает. Есть надежда, что с видеокартой тоже будет работать.

OpenCL 1.1

Tags: 

Новостные сайты массово написали, что Khronos Group выпустила спецификации OpenCL 1.1 (вот, скажем, HardOCP).

Удивительно, но на сайте Khronos об этом знаменательном событи не написано (хотя вот на HardOCP лежит 3-страничный пресс-релиз). Ну да новость сегодняшняя, сначала пресс-релиз, потом сайт...уже написано, за час справились. К сожалению, удобного содержательного диффа не обнаружилось (кроме пресс-релиза), чтобы понять разницу - нужно 300+ страниц спецификации честно прочитать.

Из пресс-релиза, естественно, ничего существенного понять нельзя.

Но есть в этом и содержательная сторона: NVidia моментально прислала письмо, что у них есть Conformance Candidate (в письме, впрочем, в некоторых местах написано что OpenCL 1.0, ну так торопились), который доступен на девелоперском сайте.

И действительно, доступен. В числе прочего, там лежат виндовые драйвера версии 258.19, которые, как я понимаю, новее и текущих доступных на оф-сайте бета-драйверов 257.15 и прилагавшихся к свежему Нексусу 257.19.

А значит можно потестироваться на предмет, исправились ли странности бета-драйверов 257.15.

CUDA 3.1 beta

На девелоперском сайте NVIdia (увы, нужен логин туда), выложили CUDA 3.1 Beta.

Из реально вкусного, там 16-way kernel concurrency, плюс обновления для CUBLAS/CUFFT.

Но:

  • Примеров (GPU Computing SDK) пока нету, только сам CUDA Toolkit.
  • Драйвера, поддерживающие все это дело - только для Tesla. Наверное, можно их поставить обычным хаком (прописав PCI IDs в setup.inf), но я не стал. Update: драйвера 257.15 для GTX480 появились на сайте NVidia в разделе с бета-драйверами.
Релиз обещают "в следующем месяце", проще подождать.

Update: в форум запостили ссылку на TPB со всем этим счастьем. Update2: С драйверами 197.xx не работает.

content classify: 

Tags: 

Про CUDA на русском

Tags: 

Судя по регулярно задаваемым тут вопросам, эта тема многих интересует, поэтому анонсирую.

Довольно давно анонсированная книга по CUDA начала, наконец, продаваться:

дешевле всего в Озоне (294 рубля), но там дата поступления в доставку- 26 апреля. В books.ru - поступление ожидается 20-го, а Болеро просто пишет что отправят за день (но не проверял).

Из аннотации:

Данная книга посвящена программированию современных графических процессоров (GPU) на основе технологии CUDA от компании NVIDIA. В книге разбираются как сама технология CUDA, так и архитектура поддерживаемых GPU и вопросы оптимизации, включающие использование .PTX.

Рассматривается реализация целого класса алгоритмов и последовательностей на CUDA.

К книге прилагается CD, который содержит примеры решения на CUDA реальных задач с большим объемом вычислений из широкого класса областей, включая моделирование нейронных сетей, динамику движения элементарных частиц, геномные исследования и многое другое.

Не читал, поэтому пока про содержание не имею мнения.

P.S. Спасибо компании NVidia (московской) за мониторинг состояния издания книги.

Курс по CUDA для всех желающих (Москва)

Tags: 

В прошлом году я прощелкал, а в этом - нет, успеваю анонсировать.

С 24 февраля по 12 мая, еженедельно, по вторникам, на ВМиК МГУ (Москва, Воробьевы горы, м. Университет) будет читаться второй уже курс программирования NVidia CUDA для всех желающих.

Процитирую из анонса:

Московский Государственный Университет им. М.В. Ломоносова совместно с компанией NVIDIA приглашает заинтересованных студентов пройти специализированный курс "Архитектура и программирование массивно-параллельных вычислительных систем" на основе технологии CUDA. В рамках курса вы узнаете о современных многоядерных архитектурах, моделях программирования и основополагающих принципах, лежащих в основе построения эффективных параллельных алгоритмов. Вы также познакомитесь с реализациями типичных алгоритмов и задач, возникающих в цифровой обработке сигналов, математическом моделировании и гидродинамике. По окончании курса вы сможете применить свои знания на практике уже сегодня при решении вычислительноемких задач в ваших курсовых и дипломных работах. Приобретенные знания необходимы для всех, кто планирует связать свое будущее с высокими технологиями и высокопроизводительными вычислениями. Всем студентам, успешно завершившим курс "Архитектура и программирование массивно-параллельных вычислительных систем" будут выданы дипломы.

Larrabee все?

Согласно статье в CNET, Larrabee будет еще не очень скоро:
Intel: Initial Larrabee graphics chip canceled
Intel said Friday that its Larrabee graphics processor will initially appear as a software development platform only.

...Intel would not give a projected date for the Larrabee software development platform and is only saying "next year."

Похоже, что кроме ATI и NVIDIA надеяться на что-то в production в ближайшие год-два не стоит.

content classify: 

Tags: 

CUDA 3.0 Beta

Tags: 

24 ноября стал публично доступен CUDA Toolkit 3.0 Beta.

Все ссылки на скачивание в теме форума NVidia, их много, не вижу смысла тут дублировать.

К сожалению, в документации обновился только Reference Manual (и он же теперь есть online), вся остальная документация несет на себе гордую надпись Version 2.3.

Для работы нужен драйвер 195-й серии (195.62 уже не бета, по меньшей мере для Windows, от клиентов можно требовать апгрейда).

Cписок новых фич, кратко (более полный список - в Release Notes):

AMD и OpenCL

Tags: 

Последняя бета-версия Stream SDK поддерживает OpenCL для GPU. Вот, собственно, весь список нововведений:

  • First beta release of ATI Stream SDK with OpenCL GPU support.
  • ATI Stream SDK v2.0 OpenCL is certified OpenCL 1.0 conformant by Khronos1.
  • Added Microsoft Windows 7 support.
  • Added native Microsoft Windows 64-bit support.
  • Float comparisons in kernels no longer produce a runtime error.
  • Various other issues from previous v2.0 beta releases have been resolved.

Берут тут: AMD Stream SDK 2.0 beta

Pages

Subscribe to RSS - Анонсы