Исследование методов построения регулярных выражений для автоматического извлечения новостных сообщений, публикуемых на Интернет-сайтахдипломная работа (Специалист)
Аннотация:Во многих задачах государственного управления и контроля возникает проблема организации информационного мониторинга ресурсов сети Интернет. Данная проблема сводится к решению задачи выделения полезной информации, прежде всего новостной, публикуемой на анализируемых сайтах. Часто данная задача решается разработкой отдельных программных модулей или специфических регулярных выражений для каждого сайта.
Дипломная работа А.В. Тимофеевой была посвящена решению актуальной задачи разработки метода автоматического порождения регулярных выражений для извлечения новостной информации, не требующих ручной подстройки при возможном периодическом изменении формата оформления материалов на Интернет-сайтах.