Reply to comment

CUDA: Решение СЛАУ

Tagged:  

Узкое место программы в решении СЛАУ. Несколько вариантов:
а) использовать имеющийся алгоритм (уже портировано и работает)
б) найти другой алгоритм, который был бы более оптимизирован для CUDA (меньше обращений к памяти, использование меньшей памяти -> возможность использования общей памяти блока)
в) использовать CUBLAS - что кардинально изменит программу.

Вопросы:
1. Какие алгоритмы вообще существуют - какими вы уже пользовались.
2. Стоит ли переносить все вычисления кроме решения СЛАУ на хост - иначе говоря, каким быстродействием обладает CUBLAS? Скорее всего не стоит, потому что решение системы делается в цикле с количеством итераций 10000 и больше. Но все же, может кто пробовал?

Reply

The content of this field is kept private and will not be shown publicly.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <i> <table> <td> <tr> <th>
  • Lines and paragraphs break automatically.
  • You can enable syntax highlighting of source code with the following tags: <code>, <blockcode>. The supported tag styles are: <foo>, [foo].
  • Images can be added to this post.

More information about formatting options

Copyright © 2008-2011 Alex Tutubalin