Анонсы

NVidia OpenCL 1.1

Tags: 

NVidia в рассылке для девелоперов сообщает нам, что в драйверах начиная с 280.13 поддерживается OpenCL 1.1

Я пощупал драйвера 280.18 для Win7/x64, и так оно и оказалось.

Проверил все примеры из AMD APP SDK, существенная часть которых раньше не работала с NVidia т.к. требовала OpenCL 1.1. Ситуация стала лучше, хотя и не идеальной:

  • Два примера должны бы работать, но не работают по причине разницы синтаксиса:
    • FluidSimulation2D ломается c диагностикой "не могу преобразовать вектора разных размеров" на конструкции вида int8 = unsigned + int8.
    • GlobalMemoryBandwidth ломается на вызове "overloadable" функции native_divide()
  • Еще три примера ломаются т.к. NVidia не поддерживает ряд расширений (что вполне ожидаемо):
    • DeviceFission - нет соответствующего расширения (хотя на Fermi его хотелось бы иметь, аппаратура то умеет)
    • SimpleDX10 - нет интеграции с DX10
    • TransferOverlap - работает, если не попросить для памяти флаг CL_MEM_USE_PERSISTENT_MEM_AMD
Но жизнь стала лучше. Например, поддерживаются 2D-изображения 16k-x-16k, вместо совершенно бессмысленных 4k-x-32k в предыдущих драйверах.

CUDA by Example на русском

Tags: 

Нам сообщают, что вышел русский перевод книги CUDA by Example.

ISBN: 978-5-94074-504-4, 978-0-13-138768-3

Доступна в онлайн-магазинах. например в Озоне и Лабиринте.

Я (исходный) английский вариант не читал, поэтому спиратил нашел в ознакомительных целях, быстро пролистал и удалил :).

CUDA 4.0

Tags: 

NVidia анонсировала CUDA 4.0

С моей колокольни интересны две вещи:

  • GPU Direct 2.0 т.е. прямая пересылка данных между (нескольки) картами, не задействуя память (и процессор?) хоста.
  • Унифицированная адресация на GPU и на хосте. Я это понял так, что адресное пространство общее, никаких отдельных сudaMemcpy.
Рассказы про остальные фишки лично меня не впечатлили (Thrust и так уже был, MPI не волнует), но будем посмотреть вживую (начиная с 4 марта).

"Интересные фишки" тоже будем посмотреть: про GPI Direct на онлайн-конференции был задан вопрос "это только для Tesla", а в момент ответа у меня пропал звук. С унифицированной адресацией у меня есть непонимание, как на эту схему ложится асинхронная передача.

Другими словами, 4-5 марта надо ломиться на nvdeveloper и брать бету на поиграться.

Конкурс HPC-GPGPU проектов

Tags: 

Не могу не отрекламировать конкурс:

Эффективное использование GPU-ускорителей при решении больших задач

(дальше просто копированием с сайта конкурса, c его страницы и с пресс-релиза):

Конкурс будет проводиться в три этапа.

На первом этапе (до 28 февраля) участники конкурса проходят процедуру регистрации и предоставляют заявки. По итогам первого этапа будет отобрано до 30 проектов, каждому из которых будет выделено поощрительное финансирование на начальный этап проведения работ в размере 100 тысяч рублей.

На втором этапе (до 25 апреля 2011) участники должны будут предоставить отчеты по результатам пробных работ первого этапа. Подключиться к участию в конкурсе можно на любом этапе его проведения. В частности, к участию во втором этапе допускаются новые проекты, заявка по которым на первом этапе не подавалась. По окончании второго этапа экспертной комиссией будет выбрано 15 заявок и выделено финансирование в размере 200 тысяч рублей на каждую задачу.

На третьем этапе (до 30 сентября 2011) участники должны предоставить отчеты о проделанной работе в виде научно-популярной статьи. Как и на втором этапе, допускается подача заявок по новым проектам, которые не участвовали на первом и втором этапах. По окончании третьего этапа будут подведены итоги конкурса и объявлены восемь проектов, которые получат по 500 тысяч рублей каждый на продолжение своих исследований. Награждение победителей пройдет в конце ноября 2011 года на 7-й суперкомпьютерной конференции RSC 2011.

Intel: OpenCL для CPU (alpha)

Tags: 

Inel выпустил альфа-версию OpenCL для CPU.

Целиком поддерживаю это начинание. Конечно, у AMD такое уже есть полтора года как, но на Intel несколько больше надежды, что это станет стандартной частью системы или, как минимум, удобным redistributable (а не частью "драйвера видеокарты", притом не общего, а отдельной версии). А для всяких GPGPU-решений появится удобный fallback на CPU.

Amazon EC2 и GPGPU

Tags: 

Амазон прислал сегодня уведомление, дескать начали продавать виртуальные машины с GPU (NVidia Tesla).

Конфигурация инстанса, вкратце:

  • 22GB памяти
  • 33.5 EC2 Compute units (это эквивалентно примерно 8-ядерному Xeon гигагерца на 2.5-3)
  • Два ядра NVidia Tesla M2050
  • 1.6TB instance storage
  • 10G-Ethernet

Подробнее здесь

Pages