Аннотация:В статье рассматривается процесс оптимизации расчётных модулей для обработки изображений под новое поколение ускорителей NVIDIA Kepler. Приведены результаты их профилировки на разных типах данных и на трёх целевых поколениях GPU (Fermi, Kepler1 и Kepler2), описаны предложенные схемы адаптации узких мест
алгоритма под каждую целевую архитектуру. Отдельно рассматривается эффект от применения каждого вида оптимизации и его зависимость от размера обрабатываемых данных. Результатом адаптации стало повышение скорости работы сервиса на новом поколении GPU в среднем в 2.4 раза