Комментировать

Интересно сделать следующий

Интересно сделать следующий тест:
Каждый поток считывает значение из памяти,
затем делает n-раз MAD над этим значением,
затем записывает результат.
И соответственно вычисляется GFlops/s .Можно даже построить график зависимости от N.
Чтобы bandwidth памяти играл не большую роль, нужно использовать большое N.
Теоретически при большом N можно получить реальную вычислительную производительность. Понятное дело что на реальных задачах она будет ниже, но имхо это хороший показатель для сравнения видеокарт.

Мне кажется что тест довольно простой и полезный, но быть может я ошибаюсь? Или возможно наткнуться на подводные камни.