Комментировать

Я к PTX (и cubin) относился

Я к PTX (и cubin) относился именно как к псевдокоду. Такому, вроде OpenGL-овских шейдеров.
А драйвер из него делает что-то для конкретного железа (в частности, экономит регистры - если это нужно)

То, что псевдокод может быть разной степени оптимальности у разных версий nvcc (по меньшей мере, теоретически) - очевидная вещь, в обсуждении не очень нуждающаяся.

Важно именно то, что PTX - это еще не окончательный код.