Reply to comment

в CUDA тоже проблем нет (с соблюдением ограничений на индексы, ну можно трехмерный массив аллоцировать).

В-общем, это оказалось прямое требование спеков OpenCL (на 34-й странице 1.0.48).

У меня пока есть одна идея, почему это так. В теории мы можем иметь три *независимых* (аж от разных процессов, друг о друге не знающих) процесса
- копирование результатов (предыдущего) расчета с устройства
- (текущий) расчет
- копирование данных (следующего) расчета.

Reply

The content of this field is kept private and will not be shown publicly.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <i> <table> <td> <tr> <th>
  • Lines and paragraphs break automatically.
  • You can enable syntax highlighting of source code with the following tags: <code>, <blockcode>. The supported tag styles are: <foo>, [foo].
  • Images can be added to this post.

More information about formatting options

Copyright © 2008-2011 Alex Tutubalin