Проблема Watchdog в винде. Как ее решить?

Всем доброго времени суток! Совсем недавно жизнь заставила погрузиться в программирование на ГПУ. Бросили меня на Win7 64-bit, дали ENGTX295 и CUDA. Начал изучение с заезженного перемножения матриц. Вот тут то и столкнулся с проблемой отказа видеодрайвера при перемножении больших матриц (в моем случае 8192*8192, памяти хватает). Интересно, что обойти проблему удалось, вставив команду ввода с клавиатуры в исполняемом на ГПУ модуле. Но такой деревенский подход не устраивает меня. На форумах пишут про 2 видюху (но не всегда при этом решается проблема) и разбиение на более мелкие кернелы.
Далее начал писать покомпонентное перемножение векторов. Проблема проснулась на превышении длины вектора 2 млн ( поигрался с организацией блок/грида ... ).
Теперь сам вопрос:1) Кто-нибудь нашел стоящее решение данной проблемы?
2) Что говорят оффы?
3) Если покупать вторую видюшку, то в дополнение к моей что лучше?

Forums: