Reply to comment

ну, thread_n 224 - мне не кажется разумным (если я правильно догадался как увас запускается kernel)
если на 512 производительность не падает.

t=224 g=256 - 671 мегаключ
t=256 g=256 - 672
t=288 g=256 - 690
и максимум я получил на t=608 (а дальше скачок вниз, ну да это все понятно почему)

Но что-бы чуть более предметно понять суть параметров - хочется понять про параметры вызова kernel
1) сетка одномерная или двумерная (или трехмерная?)
2) threads per block - ровно столько

Если сетка двумерная,конечно хотелось бы два параметра (grid_x/grid_y), ибо расти в квадрат раз - слишком много.

Правда с таймингами есть странность - на пустой машине (больше ничего нет разумного) может все просесть секунд на 20-30, потом вернуться обратно.

Reply

The content of this field is kept private and will not be shown publicly.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <i> <table> <td> <tr> <th>
  • Lines and paragraphs break automatically.
  • You can enable syntax highlighting of source code with the following tags: <code>, <blockcode>. The supported tag styles are: <foo>, [foo].
  • Images can be added to this post.

More information about formatting options

Copyright © 2008-2011 Alex Tutubalin