ATI HD4xxx и OpenCL

Читал форумы AMD, много думал.

Вычитал грустное про HD4xxx и OpenCL:

The HD4XXX series was not designed for OpenCL whereas the HD5XXX series was. There will be performance improvements on this series because of improvements in the HD5XXX series, so it will get better, but it is not our focus.
For example, if you are using local memory, they are all currently emulated in global memory. So it is possible you are going out to main memory twice as often as you do on NVidia. This can cause a fairly large performance hit if the application is memory bound. On the HD5XXX series, local memory is mapped to hardware local and thus is many times faster than the HD4XXX series.

Как мы помним на примере NVidia, ключ к высокой производительности многих приложений (ну кроме простейших молотилок, ограниченных скоростью потока из глобальной памяти) - именно в здравом использовании локальной памяти. А тут такой облом....

Другими словами, если вас интересует результат, то под 4xxx надо программировать сильно иначе, например локальный storage делать на регистрах (если их хватит).

А значит - и такую карту надо купить и иметь в хозяйстве (если интересует результат), поубивав бы.

Tags: 

Comments

От задачи же зависит. В

От задачи же зависит. В широком смысле.

Скажем, делаю я некий варез, могу поддержать 4xxx относительно недорого, могу - не поддерживать. Если поддержать - рынок станет в разы шире.

Понятно, что если варез много дороже новой видеокарты и есть большой спрос, то правильнее - не поддерживать, а слупить бабла прямо с ATI

насколько мне изестно, копию

насколько мне изестно, копию данных в видое-памяти надо держать в системной памяти если используется D3D9 (и предыдущие), и то в д3д9 необязательно, а в д3д10 тем более не надо. чтото АТИ не договаривает...

Не, это не про то. Речь о

Не, это не про то.

Речь о том, что быстрой разделяемой (между потоками) памяти /аналога shared в CUDA/ на HD4xxx нету и она эмулируется через global memory