watchdog

Я поискал по форуму и то, что нашел, запутало еще больше.

У меня есть компьютер, в котором установлены Tesla C1060(device0) и Quardo FX570(device1). Система Win7prof. x64. Через несколько секунд работы программы, которая запускается на Tesla, которая уж точно не может быть primary видеокартой, срабатывает watchdog.

Я не смог нагуглить ответ, может кто-нибудь знает как с этим справиться?

Comments

Тесла? )
можно попросить прорешать одну программку для сравнения производительности с моей gtx260? время решения у меня около 20 тминут, хотя можно и поменьше поставить.
у теслы двойная точность так же несильна как и у gtx260?

да, двойной точности просто нет. при компиляции мне говорят, что double not supported. там и с флоатами засада, они менее точны, чем на cpu. одинаковый код, посчитанный на тесла и на цпу дает результаты 999.9999 и 1000.0000 соответственно. Но там деление близких чисел, да.

зато на tesla деление на (float)0 происходит без ошибок в отличии от gts250 :)

да, погонять программу могу. пишите на почту sergeif <at> land <dot> ru

Это вообще интересная тема. У меня на server 2003, тулкит 2.3, карточка 260gtx, решается одна задачка. Монитор подключен к карте. Никаких изменений в реестр не вносилось, стоит таймаут 7 сек, вроде. В devicequery стоит YES напротив таймаута.
Время решения - 20 минут. Конечно, интерфейс при этом не отвечает, можно чай пойти попить :)
Но опытным путем было выяснено:
1. если перезагрузить машину и запустить программку, то она вылетает с таймаутом через 10-15 секунд, раз на раз не приходится.
2. Если перезагрузить машину, запустить Unigraphics NX5, открыть там детальку, закрыть Unigraphics NX5, и запустить программку, то она решается без проблем и верно, сколь много времени бы это не потребовало.
с чем это связано - непонятно.

Я б не сказал, что интересная :) Мне такие проблемы вообще не нравятся.

Реестр я тоже подравил, как тут http://www.microsoft.com/whdc/device/display/wddm_timeout.mspx
но не помогло вроде. А установка бета-дров точно помогла. Раза три перегрузился, все стабильно работает.

Спасибо за совет, приму к сведению что новые дрова решают проблему.

Попробуйте запускать CUDA код на device1, проверьте сработает ли watchbog.
Если да - то проверьте к какому девайсу прикреплен рабочий стол винды.

Device Query из SDK содержит поле Run time limit on kernels. Какое значение для Теслы?
Спрашиваю потому что никогда с Теслой не работал, и хотя по уму там должно бы No стоять, не исключаю возможности что Yes.

проблема решилась установкой beta-драйвера 191.78. Работает две с половиной минуты нормально и выдает верный результат.

И у Tesla и у Quadro стоят No.

И у Tesla и у Quadro стоят No.

а точно на тесле решается? как вы в этом убеждаетесь?

int dev;
cudaDeviceProp devProp;
cudaGetDevice(&dev);
cudaGetDeviceProperties(&devProp, dev);
printf("Name: %s\n", devProp.name);

Потому что казалось бы:

cudaError_t cudaGetDevice( int* dev )
DESCRIPTION
Returns in *dev the device on which the active host thread executes the device code.

Copyright © 2008-2009 Alex Tutubalin