Комментировать

Kernel'ы полностью в

Kernel'ы полностью в исходниках(OpenCL), exe'шники идентичные использовал.
Для выявления ядра, которое даёт сбой, надо дампить все промежуточные результаты танцуя с драйверами и выявлять место, где появится первое расхождение. Кстати, сначала(первые тысяч пять итераций) сходится очень похоже на запуск с нормальными драйверами(невязка практически одинаковая, может даже одинаковая). Нужно ещё попробовать разные варианты - SingleDouble, SingleSingle, DoubleDouble.
Если будет время, то конечно отправлю баг репорт с test-case'ом, если времени не будет, то постараюсь просто баг репорт.