Комментировать

В CUDA 4.1 они похваляются

В CUDA 4.1 они похваляются новым компилятором, на llvm, от которого все становится быстрее :)

Код точно становится другим - поэтому профайлер в руки, без него ничего сказать невозможно