Сортировка и суммирование с накоплением в разделяемой памяти.

Какую библиотеку использовать или где найти алгоритмы для сортировки и суммирования с накоплением, аналогичные thrust::sort и thrust::inclusive_scan, только для Shared Memory?
Т.е. в пределах одного блока, без обращения к глобальной памяти.

Forums: 

Неужели библиотеки

Неужели нет библиотеки стандартных алгоритмов аналогичных Thrust, но для shared memory с соответствующим intra-block API?
Или хотя бы несколько из них, наиболее популярных: stable_sort_by_key, invlusive_scan и histogram/count_by_key.