float и double одновременно

Возможно ли задействовать одновременно float и double блоки-вычислители(физические) в одном потоке?
Грубо говоря можно ли сделать синтетический тест который покажет больше (single)flops используя одновременно double и signle (в этом случае предполагается double вычислитель как-бы эмулирует single вычисления(я думаю многие задачи от такой эмуляции не пострадают(то есть от немного повышенной точности)).
Также интересует какова скорость преобразования double<->single, может не стоит с этим связываться?
Меня интересуют устройства типа gtx280/285/480(может уже есть такие), nvidia карточки у меня пока нет, так что проверить не могу..
Зачем это нужно? Далеко не все задачи упираются в ПСП, и лишние флопсы не помешают.

Forums: 

Насколько я понимаю, на GTX

Насколько я понимаю, на GTX 2xx double-вычисления делаются на отдельном блоке и там, теоретически, какое-то ускорение возможно.
На compute capability 2.0 за single и double вроде как отвечают одни и те же вычислительные модули