Анонсы

NVidia OpenCL 1.1

NVidia в рассылке для девелоперов сообщает нам, что в драйверах начиная с 280.13 поддерживается OpenCL 1.1

Я пощупал драйвера 280.18 для Win7/x64, и так оно и оказалось.

Проверил все примеры из AMD APP SDK, существенная часть которых раньше не работала с NVidia т.к. требовала OpenCL 1.1. Ситуация стала лучше, хотя и не идеальной:

  • Два примера должны бы работать, но не работают по причине разницы синтаксиса:
    • FluidSimulation2D ломается c диагностикой "не могу преобразовать вектора разных размеров" на конструкции вида int8 = unsigned + int8.
    • GlobalMemoryBandwidth ломается на вызове "overloadable" функции native_divide()
  • Еще три примера ломаются т.к. NVidia не поддерживает ряд расширений (что вполне ожидаемо):
    • DeviceFission - нет соответствующего расширения (хотя на Fermi его хотелось бы иметь, аппаратура то умеет)
    • SimpleDX10 - нет интеграции с DX10
    • TransferOverlap - работает, если не попросить для памяти флаг CL_MEM_USE_PERSISTENT_MEM_AMD
Но жизнь стала лучше. Например, поддерживаются 2D-изображения 16k-x-16k, вместо совершенно бессмысленных 4k-x-32k в предыдущих драйверах.

CUDA by Example на русском

Нам сообщают, что вышел русский перевод книги CUDA by Example.

ISBN: 978-5-94074-504-4, 978-0-13-138768-3

Доступна в онлайн-магазинах. например в Озоне и Лабиринте.

Я (исходный) английский вариант не читал, поэтому спиратил нашел в ознакомительных целях, быстро пролистал и удалил :).

Книга производит очень приятное впечатление как по порядку изложения материала, так и по полноте: помимо базовых вещей не забыты текстуры, не забыто взаимодействие с OpenGL/DX. В ней нет ничего про "продвинутые оптимизации", а вот как базовое изложение - очень понравилось.

О качестве русского перевода пока ничего сказать не могу.

CUDA 4.0

NVidia анонсировала CUDA 4.0

С моей колокольни интересны две вещи:

  • GPU Direct 2.0 т.е. прямая пересылка данных между (нескольки) картами, не задействуя память (и процессор?) хоста.
  • Унифицированная адресация на GPU и на хосте. Я это понял так, что адресное пространство общее, никаких отдельных сudaMemcpy.
Рассказы про остальные фишки лично меня не впечатлили (Thrust и так уже был, MPI не волнует), но будем посмотреть вживую (начиная с 4 марта).

"Интересные фишки" тоже будем посмотреть: про GPI Direct на онлайн-конференции был задан вопрос "это только для Tesla", а в момент ответа у меня пропал звук. С унифицированной адресацией у меня есть непонимание, как на эту схему ложится асинхронная передача.

Другими словами, 4-5 марта надо ломиться на nvdeveloper и брать бету на поиграться.

Конкурс HPC-GPGPU проектов

Не могу не отрекламировать конкурс:

Эффективное использование GPU-ускорителей при решении больших задач

(дальше просто копированием с сайта конкурса, c его страницы и с пресс-релиза):

Конкурс будет проводиться в три этапа.

На первом этапе (до 28 февраля) участники конкурса проходят процедуру регистрации и предоставляют заявки. По итогам первого этапа будет отобрано до 30 проектов, каждому из которых будет выделено поощрительное финансирование на начальный этап проведения работ в размере 100 тысяч рублей.

На втором этапе (до 25 апреля 2011) участники должны будут предоставить отчеты по результатам пробных работ первого этапа. Подключиться к участию в конкурсе можно на любом этапе его проведения. В частности, к участию во втором этапе допускаются новые проекты, заявка по которым на первом этапе не подавалась. По окончании второго этапа экспертной комиссией будет выбрано 15 заявок и выделено финансирование в размере 200 тысяч рублей на каждую задачу.

На третьем этапе (до 30 сентября 2011) участники должны предоставить отчеты о проделанной работе в виде научно-популярной статьи. Как и на втором этапе, допускается подача заявок по новым проектам, которые не участвовали на первом и втором этапах. По окончании третьего этапа будут подведены итоги конкурса и объявлены восемь проектов, которые получат по 500 тысяч рублей каждый на продолжение своих исследований. Награждение победителей пройдет в конце ноября 2011 года на 7-й суперкомпьютерной конференции RSC 2011.

Intel: OpenCL для CPU (alpha)

Inel выпустил альфа-версию OpenCL для CPU.

Целиком поддерживаю это начинание. Конечно, у AMD такое уже есть полтора года как, но на Intel несколько больше надежды, что это станет стандартной частью системы или, как минимум, удобным redistributable (а не частью "драйвера видеокарты", притом не общего, а отдельной версии). А для всяких GPGPU-решений появится удобный fallback на CPU.

Кроме того, c OpenCL для CPU есть гораздо больше надежды на авто-векторизацию: стандартные векторные типы и все такое. Ну и ряд других вкусностей, таких как анализ OpenCL-кода с помощью VTune (анонсировано, но я не пробовал).

Ссылки:

Ну и на первой странице из списка есть ссылки на много других материалов.

Я помацал это дело руками минут 15 и остался в некотором недоумении.

Amazon EC2 и GPGPU

Амазон прислал сегодня уведомление, дескать начали продавать виртуальные машины с GPU (NVidia Tesla).

Конфигурация инстанса, вкратце:

  • 22GB памяти
  • 33.5 EC2 Compute units (это эквивалентно примерно 8-ядерному Xeon гигагерца на 2.5-3)
  • Два ядра NVidia Tesla M2050
  • 1.6TB instance storage
  • 10G-Ethernet
Подробнее здесь

Стоит это удовольствие $2.10 в час (плюс плата за трафик и за дополнительный сторадж, если потребуются) при оплате по потреблению. Если планируется большое потребление, есть варианты взять подешевле, смотрите цены.

Наличие 10G очень приятно: можно поднимать большие (и очень большие) кластеры.

Мне казалось, что Амазон не первый такой, однако быстрое гуглование не нашло ни одного сервиса, который предлагал бы (виртуальные) машины с Теслой и с почасовой оплатой без платы за установку/запуск. Поправьте меня, если конкуренты таки есть.

Update: Доступны первые бенчмарки из коих следует, что виртуализация практически не мешает, а на некоторых тестах Амазон оказался и вовсе быстрее, чем тестовое сравнительное железо....

Copyright © 2008-2011 Alex Tutubalin