Комментировать

По поводу NBody - на линуксе

По поводу NBody - на линуксе что-то около 650 было.
По поводу увлечения производительности в двое - можно какое-нибудь bogoFlops запустить.
По поводу других приложений - многие зависят от скорости памяти. Также теперь запрос в память идёт от варпа, а не от половины, это надо учитывать.
По поводу кэша - он открывает новые возможности, например если для варпа нужно считать два числа из глобальной памяти, раньше считывали двумя потоками в локальную память, а оттуда читали остальные(сейчас ещё +broadcasting), сейчас можно всеми потоками считать сразу из глобальной памяти(на таком примере я получил прирост скорости, но могу ошибаться, может причина в другом). Это даёт меньший divergence branch.