Комментировать

Ну подождите, coalesced или

Ну подождите, coalesced или не-coalesced решает контроллер памяти. Он видит запросы от всех нитей, дальше режет их на 128-байтные (или сколько там) блоки с соответствующим выравниванием, а дальше для каждого блока ходит в память.

Если все делать правильно, то весь (полу)варп удовлетворится одной транзакцией по памяти.

Но никаких особых "раздумий" в этом месте нет, все происходит в соответствии с архитектурой памяти.