ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ИНХС РАН |
||
В начале XXI века получили значительное распространение большие электронные базы мультимедийного контента, такого как видео, изображения и аудио. Массовое использование этих баз требует эффективных алгоритмов сжатия, обработки и поиска мультимедийной информации. При наличии открытого доступа к базам видео через Интернет возникает потребность в алгоритмах поиска в базе похожих видеофрагментов. Эти алгоритмы могут быть использованы как для оптимизации хранения данных путём удаления дубликатов, так и для полуавтоматического выявления фактов нарушения авторских прав в новых видеофрагментах. Предложенный алгоритм поиска дубликатов видеофрагментов основывается на сопоставлении дерева сцен видеофрагмента-запроса и фильма в базе видео. Алгоритм состоит из трех основных этапов: 1. Разбиение видеопоследовательности на сцены; 2. Построение дерева сцен; 3. Сравнение деревьев сцен. Благодаря использованию только временной информации о сменах сцены и величин разности кадров при смене сцены, предложенный алгоритм поиска дубликатов видео устойчив к большинству характерных искажений цифрового видео, таких как изменение яркости и контраста, сжатие видео, изменение размеров видео, добавление субтитров и логотипов, и многих других. Незначительное количество необходимых данных для сопоставления позволяет строить небольшие по размеру индексы видеофрагментов. Малая сложность сравнения двух фильмов и возможность создания иерархических индексов по фильмам базы данных позволяет говорить об эффективности предложенного алгоритма по скорости работы. Дальнейшим развитием алгоритма может являться отслеживание локального изменения цветовых характеристик вблизи смены сцены и использование хеш-таблиц для ускорения поиска дубликатов в больших базах фильмов.