Комментировать

ATI HD4xxx и OpenCL

Читал форумы AMD, много думал.

Вычитал грустное про HD4xxx и OpenCL:

The HD4XXX series was not designed for OpenCL whereas the HD5XXX series was. There will be performance improvements on this series because of improvements in the HD5XXX series, so it will get better, but it is not our focus.
For example, if you are using local memory, they are all currently emulated in global memory. So it is possible you are going out to main memory twice as often as you do on NVidia. This can cause a fairly large performance hit if the application is memory bound. On the HD5XXX series, local memory is mapped to hardware local and thus is many times faster than the HD4XXX series.

Как мы помним на примере NVidia, ключ к высокой производительности многих приложений (ну кроме простейших молотилок, ограниченных скоростью потока из глобальной памяти) - именно в здравом использовании локальной памяти. А тут такой облом....

Другими словами, если вас интересует результат, то под 4xxx надо программировать сильно иначе, например локальный storage делать на регистрах (если их хватит).

А значит - и такую карту надо купить и иметь в хозяйстве (если интересует результат), поубивав бы.

Tags: