Комментировать

Ну вот конкретно для

Ну вот конкретно для dgemm/sgemm важна не скорость чтения из глобальной памяти, а скорость работы локального стораджа (регистров + shared memory). Как раз с глобальной памятью у радеонов все хорошо и вычислятор тоже быстрый.