Как учитывать ограничение в памяти видухи? Дайте совет по идеологии вычислений!

Вопрос 1:
Опишу простую задачу и способ ее решения. Я мануал конечно читал, но мне нужен совет по реализации вычислений на CUDA. Допустим, есть N штук ядер на видухе, есть матрица A, где n-количество строк матрицы(четное количество), а m-количество столбцов матрицы. Нужно сложить попарно строки матрицы А. Предполагается, что N

Forums: