Комментировать

Intel MKL vs GotoBLAS

по моему опыту, SGEMM в Intel MKL (какая-то из 10-х версий) работает гораздо быстрее в 64-битном режиме. Разница примерно такая: 24 Gflop/s при запуске в 32-битных виндах и 38 Gflop/s в 64-битных на 2.67 GHz Core2 Duo E6700. То есть 64-битный Intel MKL тоже может работать под 90% пика, как и Гото. Наблюдал аналогичную картину и на четырёх ядерных процессорах.

Одно объяснений этому явлению что я слышал --- в 2 раза больший размер доступного файла регистров в 64-битном режиме по сравнению с 32-битным. Соответственно, можно использовать большие блоки в регистрах чтобы разрешить нехватку скорости кеша.