Аннотация:В выпускной работе рассматривается задача распознавания жестов рук по видео. В качестве объекта исследования используются видеосъёмки примеров одного из диалектов языка жестов. Задача состоит в классификации наблюдаемого жеста на видео путем сравнения его с эталонами-образцами, также представленными видеофильмами. В работе исследован подход к построению меры сходства-различия жестов рук на основе сравнения траекторий движения и динамической позы (формы) ладоней. В рамках этого подхода разработан метод количественной оценки сходства жестов в широком диапазоне вариации исходных данных, в частности, жесты выполняются разными спикерами при разных условиях съемки. Автором исследования были разработаны методы решения следующих задач.
1. Построение траектории ладоней спикера на основе покадровой сегментации видео с помощью нейросети, строящей шарнирный скелет фигуры человека.
2. Количественная оценка сходства-различия жестов на основе нормализации и выравнивания полученных траекторий ладоней.
3. Определение ключевых поз жеста на основе локализация и выделения формы ладоней в кадрах и оценки длительности представления поз в видеопоследовательности.
4. Оценка сходства-различия жестов по форме ладоней в ключевых позах.