Комментировать

PTX - это пседоассемблер,

PTX - это пседоассемблер, вроде OpenGL-ного. .cubin - оно же, но бинарное (судя по результатам работы decuda). Не оптимизированный по использованию регистров, насколько я вижу.

Ну оптимизация в разных компиляторах может быть чуть получше, но мы же начали не про этот эффект (или я так понял). Да, естественно, за счет лучшей оптимизации в более других версиях может стать получше. А на каком-то коде какому-то конкретному компилятору может рвать крышу, отчего код будет совсем неэффективный. Это все понятно.

Я скорее про то, что "при прочих равных" (одинаковой оптимизации) перекомпилировать из .cu в .ptx/cubin вроде бы не надо (с поправкой на поддерживаемые форматы cubin)