Комментировать

GPU имеет SIMD архитектуру,

GPU имеет SIMD архитектуру, что значит оперирует с векторами, а не со скалярами. Скалярные треды - это лишь програмная модель популярная в графических задачах. Эту модель можно использовать и для программирования SSE юнитов на ядрах Core2 (и Pentium), считая что один SSE юнит исполняет 4 скалярных треда в одинарной точности. Навряд ли вы будете в таком случае использовать 4 стека на ядро. Точно так же, редко кто использует 32 стека на векторном процессоре с длиной вектора 32.

Стек, как правило, нужен не сам по себе, а для решения какой-то задачи. Расскажите какая задача, может дам более конкретный ответ.