Reply to comment

Вот к примеру два жестких диска - у одного transfer вдвое быстрее, а у другого - seek. Какой "быстрее" ? Не зная задачи, выбрать невозможно, для streaming оптимален один, для базы данных - другой.

И это вообще проблема бенчмарок. Ну вот прогнали gpubench, получили набор из 10 цифр для разных операций. А какая операция будет наиболее проблемной для конкретной задачи - трудно узнать.

В этом смысле SGEMM/DGEMM или FFT как вычислительные бенчмарки очень хороши - про них многое известно, накоплена большая база и т.п..

Что касается BarsWF - это тоже очень интересная метрика, но ее можно рассматривать только по модулю автора (скажем, мне тамошнее масштабирование очень удивительно и я пока сам руками не пощупаю - а исходников нет - не могу быть убежден, что там с occupancy все нормально. Правда я только версию 0.7 смотрел).

Reply

The content of this field is kept private and will not be shown publicly.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <i> <table> <td> <tr> <th>
  • Lines and paragraphs break automatically.
  • You can enable syntax highlighting of source code with the following tags: <code>, <blockcode>. The supported tag styles are: <foo>, [foo].
  • Images can be added to this post.

More information about formatting options

Copyright © 2008-2011 Alex Tutubalin