Reply to comment

Немного потестил - сходимость такая же, как и была на предыдущей whql. Цифирки(норма вектора невязки) совпадают полностью(все значащие цифры в double), что намекает на то, что вычисления остались такими же(по результату), если были бы другие - через 15k итераций наверняка бы проявилась разница. Количество итераций такое же.

Ускорение GFlops на SPMV 1.11
Ускорение итераций 1.09
Ускорение ПСП (на ядре DAEqB, http://www.gpgpu.ru/node/180#comment-1507) 1.03

Судя по значительно ускорившемуся GFlops на SPMV, для которого главное сейчас ПСП, и незначительно ускорившемуся ПСП, double вычисления стали ощутимо быстрее(я думаю >10%). Ядер для bogoFlops не делал..

Приятно получить такой бонус ничего не делая, конечно заново строить графики в пояснялке не буду - не успею..

Reply

The content of this field is kept private and will not be shown publicly.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <i> <table> <td> <tr> <th>
  • Lines and paragraphs break automatically.
  • You can enable syntax highlighting of source code with the following tags: <code>, <blockcode>. The supported tag styles are: <foo>, [foo].
  • Images can be added to this post.

More information about formatting options

Copyright © 2008-2011 Alex Tutubalin