мини-соревнования

Может организуемся (используем для этого этот сайт) и проведем на сайте мини-соревнования по небольшим задачам, как то "игра Жизнь", моделирование потока жидкости (правила не сложные) как у znah.livejournal.com. Может из крипто-задач кто-нибудь что-нибудь предложит... Или любые другие. Если кто предлагает задачу, тот тогда и полностью описывает все формулы, ограничения.
Для того, чтобы обменяться опытом, пообсуждать, повысить свой опыт.

Forums: 

перебор MD5 на карте

перебор MD5 на карте RadeonHD3870 - 142000000 пасс/сек достижим в реальном тесте
на RadeonHD4870 - 399000000 пасс/сек - теоретические выводы, основанные на тесте RadeonHD3870(увеличение скорости в 7/6 раза за счет более совершенных ПП, в 2,5 раза - за счет увеличения кол-ва ПП, снижение скорости в 750/777 раза за счет более низкой частоты)

Вау! А можно я про вас на

Вау!

А можно я про вас на голове данного сайта новость напишу?

BTW, если есть желание писать сюда (тексты, статьи, что угодно) - это можно и даже нужно. У меня на все мои проекты времени не хватает категорически.

Можно все. НАписать

Можно все. НАписать смогу.
Ограничение времени работы - сначала делаем бенчмарк каждого GPU, потом считаем сколько ключей выдавать за один вызов.

Ага, про ограничение -

Ага, про ограничение - понятно. Анонс на первой странице - не удержался и уже сделал.

По остальному - если вы зарегистрируетесь на сайте и пришлете через обратную связь логин - надаю прав для писания.

Я сделал прорыв! На

Я сделал прорыв! На Radeon3870 добился скорости перебора на наборе символов АНСИ 33-126 в 285*10^6 pass/s!!!

И, кстати, как вы

И, кстати, как вы ограничиваете время работы GPU kernel? Просто подбором (проверяем млн ключей, меряем время, запускаем большой батч) или таки нашли методу остановить kernel снаружи (летом тут люди спрашивали, я помочь не сумел)

Граждане, редакция сайта

Граждане,

редакция сайта полностью за. Если нужна какая-то помощь (ну там голосования, отдельный раздел на сайте "конкурсы" и т.п.) - поможем, только обращайтесь!

Ну незнаю. Из алгоритмов

Ну незнаю. Из алгоритмов демозаики (RAW) это один из самых лучших и самых тяжелых. http://scien.stanford.edu/class/psych221/projects/99/tingchen/algores/co...
А на GPU его можно распараллелить. Да и толку больше чем от MD5.

А так их много разных вариантов: http://scien.stanford.edu/class/psych221/projects/99/tingchen/main.htm
И реализации медленные есть: http://libdc1394-22.sourcearchive.com/documentation/2.0.2/bayer_8c-sourc...

Я не понимаю. Вот вы сначала

Я не понимаю. Вот вы сначала пишете слово dcraw, отлично. А потом даете ссылки на алгоритмы, где есть много всякого, но нету AHD. При том, что AHD в упомянутой исходно dcraw - есть. Кривенький, косенький, но есть.

Я бы не удивился, если бы было предложение AHD вынести на CUDA - неплохая сама по себе идея (только не та реализация, которая у Коффина), но VNG зачем?

С моей точки зреня, заниматься нужно сначала качеством, а уже потом - количеством

Про качество/количество спору

Про качество/количество спору нет. Хотя я тоже не понял как это относится к VNG.
AHD не плохой алгоритм, но я с самого начала вопрошал о "VNG в dcraw".
И акцент именно на VNG.
А все это к тому, что нету пока вообще никакой реализаций демозаики для GPU.
Вот и повод для конкурса :)

Я хочу сказать две вещи 1)

Я хочу сказать две вещи
1) Как генератор preview (контактных отпечатков) dcraw вполне можно использовать. Но для этого вполне достаточно half-интерполяции
2) Как финальный рендер - качество мне не кажется разумным. А значит ускорять тамошние медленные алгоритмы - нет смысла т.к. нет качества.

Вместе с тем, мне доподлинно известно, что работы по переносу dcraw на CUDA уже ведутся (подробности наверное не могу рассказывать, но не мной). Кроме того, конечно есть применения, где half недостаточно, но нужен рендер огромного количества кадров. Но индустрия, которой это нужно, - платежеспособна, вот и пусть платит.

Ага :) для preview (down

Ага :) для preview (down sampling) демозаика как третья нога. То есть опера немного не та.
Алгоритмы там всего лишь реализованы. И вроде как VNG != dcraw.
Да и дела мне нету до dcraw, но алгоритм ради алгоритма както не кошерно выходит.
dcraw тут выступает просто как оболочка для быстрого просмотра полученного результата.
Приятно же пачкой отрендерить быстро целую папку фоток. На качество вроде как никто не жаловался.
Встроенная в камеры демозаика зачастую хуже. И с алгоритмической стороны демозаика интересна.
А проблемы индустрии пусть у нее и останутся :)

Да вобщемто пусть это будет [любой интересный алгоритмически и качественный (в каком то смысле) алгоритм демозаики]. Даже лучше два - чтобы было с чем сравнивать :)
На VNG и dcraw мы наложим вето.

Я самую малость всем этим

Я самую малость всем этим интересуюсь, поверьте (см. libraw.org)

К несчастью, просто демозаики недостаточно. Т.е. ускорять постпроцессинг в dcraw - это как гальванизировать труп, интересно, но бессмысленно (я не имею ничего против алгоритмов распаковки raw-данных в dcraw, но имею много против тамошнего постпроцессинга).

К сожалению, реальная работа с хорошим качеством упирается в ряд вещей, которые и теоретически то не очень проработаны. Скажем, интерполяцию надо вести в линейном пространстве, причем хорошо бы, чтобы там была яркостная ось (т.е. в YCC или в XYZ). Но мы не можем перейти в это линейное пространство не зная цвета (т.е. не сделав интерполяцию). В результате, первый этап - получение качества которое есть смысл ускорять - сам по себе сильно растягивается (либо надо этим заниматься full-time, что у меня пока не получается)

Но, конечно, я никоим образом не собираюсь никому мешать гальванизировать труп ускорять dcraw. Более того, если результат будет хорошим и с хорошей лицензией (GPL или BSD), я могу и в LibRaw оный результат вставить, отчего у всех пользователей KDE-приложений (digikam и так далее) наступит счастье и одержание.