Reply to comment

Да я вроде не предлагал увеличивать количество чтений :) Вы читали блоками 16х16 нитей матрицу 16х16, или, если учитывать пересекающиеся края, 18x18. Я предлагал блоком 16x16 нитей читать матрицу 30x30 с пересекающимися краями, то есть 32x32. Число чтений меньше, чем в Вашем исходном варианте.

Единственное что непонятно при этом, важно ли Вашему алгоритму, что блок обрабатывает блок именно 16х16. По косвенным признакам похоже, что все-таки блок 16x16 памяти это важно. Если это действительно так, и нельзя никак изменить обработку блока 16x16 на обработку блока 30x30, то тогда имеет смысл все пересекающиеся края блоков вынести в отдельные массивы.

Reply

The content of this field is kept private and will not be shown publicly.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <i> <table> <td> <tr> <th>
  • Lines and paragraphs break automatically.
  • You can enable syntax highlighting of source code with the following tags: <code>, <blockcode>. The supported tag styles are: <foo>, [foo].
  • Images can be added to this post.

More information about formatting options

Copyright © 2008-2011 Alex Tutubalin