Reply to comment

по моему опыту, SGEMM в Intel MKL (какая-то из 10-х версий) работает гораздо быстрее в 64-битном режиме. Разница примерно такая: 24 Gflop/s при запуске в 32-битных виндах и 38 Gflop/s в 64-битных на 2.67 GHz Core2 Duo E6700. То есть 64-битный Intel MKL тоже может работать под 90% пика, как и Гото. Наблюдал аналогичную картину и на четырёх ядерных процессорах.

Одно объяснений этому явлению что я слышал --- в 2 раза больший размер доступного файла регистров в 64-битном режиме по сравнению с 32-битным. Соответственно, можно использовать большие блоки в регистрах чтобы разрешить нехватку скорости кеша.

Reply

The content of this field is kept private and will not be shown publicly.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <i> <table> <td> <tr> <th>
  • Lines and paragraphs break automatically.
  • You can enable syntax highlighting of source code with the following tags: <code>, <blockcode>. The supported tag styles are: <foo>, [foo].
  • Images can be added to this post.

More information about formatting options

CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.

Copyright © 2008-2009 Alex Tutubalin