Комментировать

90 dFLOPS CNET криво

90 dFLOPS CNET криво посчитал. реально 3(dFPU)*10(TC)*1,3(freq)*2(MAD)=78 dFLOPS
думаю реально будет меньше, т.к. архитектура заточена читать из памяти и регистров по 32 бита, плюс double могут "обидеть" в pipeline и тп, ведь для графики он не нужен. но всё равно, даже в 10 раз медленее чем float он полезен для mixed precision схем, как вы упомянули.