Комментировать

Бенчмаркинг - вообще очень трудная задача

Вот к примеру два жестких диска - у одного transfer вдвое быстрее, а у другого - seek. Какой "быстрее" ? Не зная задачи, выбрать невозможно, для streaming оптимален один, для базы данных - другой.

И это вообще проблема бенчмарок. Ну вот прогнали gpubench, получили набор из 10 цифр для разных операций. А какая операция будет наиболее проблемной для конкретной задачи - трудно узнать.

В этом смысле SGEMM/DGEMM или FFT как вычислительные бенчмарки очень хороши - про них многое известно, накоплена большая база и т.п..

Что касается BarsWF - это тоже очень интересная метрика, но ее можно рассматривать только по модулю автора (скажем, мне тамошнее масштабирование очень удивительно и я пока сам руками не пощупаю - а исходников нет - не могу быть убежден, что там с occupancy все нормально. Правда я только версию 0.7 смотрел).