Reply to comment

заменить не-coalesced чтение на чтение из текстуры вовсе не сложно. Надо только привязать текстуру, скажем tExpressions, к участку памяти где хранятся выражения --- cudaBindTexture(0, tExpressions, pExpressions, size), и вместо pExpressions[index] писать tex1Dfetch(tExpressions,index). Я думаю одно это может дать сильный прирост, поскольку устраняет не-coalesced доступ и снижат нагрузку на шину памяти.

А зачем вы запускаете максимальное количество потоков на блок? И сколько это получается? Какова максимальная глубина стека?

Reply

The content of this field is kept private and will not be shown publicly.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <i> <table> <td> <tr> <th>
  • Lines and paragraphs break automatically.
  • You can enable syntax highlighting of source code with the following tags: <code>, <blockcode>. The supported tag styles are: <foo>, [foo].
  • Images can be added to this post.

More information about formatting options

CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.

Copyright © 2008-2009 Alex Tutubalin