GPGPU.RU: Новые публикации

Intel OpenCL 1.5: AVX, отладчик, но плохая производительность

Tags: 

Пощупал вышедший вчера Intel OpenCL SDK 1.5.

Заявленные новые фишки:

  • Поддержка AVX-векторизации (т.е. векторов в 256 бит)
  • Отладчик
Имею сказать:
Отладчик
Отладчик - работает. Пошаговая отладка, просмотр значений переменных, все отлично. С каким конкретно потоком работать - задается до запуска программы.

Несколько неудобно то, что путь до файла с исходными текстами передается в флагах компиляции. Казалось бы, компилятор все видит в момент компиляции, однако ж.

Статьи по понедельникам

Tags: 

Не могу не поделиться очередным источником полезных ссылок по теме GPGPU.

Сайт StreamComputing.eu (за новостями которого лично я слежу через Твиттер) завел очень полезный обычай: по понедельникам они публикуют подборки статей по тематике GPGPU, кластеров и всего подобного.

5-го сентября вроде что-то тоже было, но разрозненно и в твиттере.

Язык, увы, английский.

NVidia OpenCL 1.1

Tags: 

NVidia в рассылке для девелоперов сообщает нам, что в драйверах начиная с 280.13 поддерживается OpenCL 1.1

Я пощупал драйвера 280.18 для Win7/x64, и так оно и оказалось.

Проверил все примеры из AMD APP SDK, существенная часть которых раньше не работала с NVidia т.к. требовала OpenCL 1.1. Ситуация стала лучше, хотя и не идеальной:

  • Два примера должны бы работать, но не работают по причине разницы синтаксиса:
    • FluidSimulation2D ломается c диагностикой "не могу преобразовать вектора разных размеров" на конструкции вида int8 = unsigned + int8.
    • GlobalMemoryBandwidth ломается на вызове "overloadable" функции native_divide()
  • Еще три примера ломаются т.к. NVidia не поддерживает ряд расширений (что вполне ожидаемо):
    • DeviceFission - нет соответствующего расширения (хотя на Fermi его хотелось бы иметь, аппаратура то умеет)
    • SimpleDX10 - нет интеграции с DX10
    • TransferOverlap - работает, если не попросить для памяти флаг CL_MEM_USE_PERSISTENT_MEM_AMD
Но жизнь стала лучше. Например, поддерживаются 2D-изображения 16k-x-16k, вместо совершенно бессмысленных 4k-x-32k в предыдущих драйверах.

CUDA by Example на русском

Tags: 

Нам сообщают, что вышел русский перевод книги CUDA by Example.

ISBN: 978-5-94074-504-4, 978-0-13-138768-3

Доступна в онлайн-магазинах. например в Озоне и Лабиринте.

Я (исходный) английский вариант не читал, поэтому спиратил нашел в ознакомительных целях, быстро пролистал и удалил :).

Вышли CUDA 4.0 & Parallel Nsight 2.0 (релизы)

Tags: 

Вышли релизные версии:

Какой-то принципиальной разницы с RC2-версиями из документации не видно, каких-то критичных багов в RC2 я тоже не находил.

Вот в драйверах разница заметна, копирование хост-видеокарта и обратно в драйвере 270.81 (доступен по первой ссылке) где-то на 10% быстрее, чем в текущем 270.61 WHQL.

Pages

Subscribe to GPGPU.RU: Новые публикации