Reply to comment

Если время позволяет, то почему бы и нет. Всё же я советую написать сначала пояснительную записку, а потом уже экспериментировать и в случае получения какого-то результата вставить отдельную главу.

Имхо реализовывать на Cuda будет несколько быстрей чем на OpenCL - меньше служебных вызовов, соответственно меньше возможных багов.
Также если не возиться с интерфейсами(абстрактными классами) и не заботиться о гибкости, а непосредствено реализовывать решатель, можно управиться за день, тем более у вас есть опыт реализации этого алгоритма параллельно.

Интересно, почему было выбрано OpenMP, а не допустим MPI(конечно это разные вещи, но всё же). И дало-ли использование многопоточности на системе с разделяемой памятью ощутимый прирост скорости(тут конечно всё от системы зависит, может огромная ПСП и относительно слабые потоки как на видеокарте, то без параллельности никак).

Reply

The content of this field is kept private and will not be shown publicly.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <i> <table> <td> <tr> <th>
  • Lines and paragraphs break automatically.
  • You can enable syntax highlighting of source code with the following tags: <code>, <blockcode>. The supported tag styles are: <foo>, [foo].
  • Images can be added to this post.

More information about formatting options

CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.

Copyright © 2008-2009 Alex Tutubalin