ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ИНХС РАН |
||
Решаемые задачи: 1) развитие методов классификации и кластеризации слабоструктурированных данных: 1.1) разработка эффективных методов расчета матриц близости между документами в больших текстовых коллекциях; 1.2) поиск оптимального сочетания методов машинного обучения и методов, основанных на знаниях экспертов; 2) развитие методов выделения информации в слабоструктурированных данных: 2.1) определение в полнотекстовых документах упоминаний объектов известной структуры (имен, должностей, организаций, адресов и т.п.), как с использованием внешних баз данных, так и статистических методов машинного обученяи; 2.2) исследование методов структуризации атрибутивной и фактографической информации; 3) развитие методов интеграции разных способов доступа к накопленным данным: 3.1) разработка методов визуализации сложных взаимосвязей данных разной природы; 3.2) разработка механизмов для встраивания настраиваемых пользователем моделей анализа данных, в том числе иерархически организованных.
госбюджет, раздел 0110 (для тем по госзаданию) |
# | Сроки | Название |
1 | 1 января 2014 г.-31 декабря 2014 г. | Методы построения информационных систем на основе автоматизированной содержательной обработки слабоструктурированных данных |
Результаты этапа: - Разработаны методы улучшения состава тематических моделей, включающих многословные выпажения, на основе улучшения отбора терминоподобных слов и выражений - Разработаны методы визуализации когнитивных схем объектов и субъектов тематической коллекции новостных документов - Сформирован эффективный расчетный комплекс параллельной обработки больших массивов текстовой информации - Реализованы опытные образцы информационно-аналитических систем мониторинга, анализа и прогнозирования сложных социально-политических или научно-технологических процессов на основе массового автоматизированного формирования аналитических отчетов различных типов путем последовательного решения задачи поиска, классификации, выделения информации, кластеризации и обзорного реферирования | ||
2 | 1 января 2015 г.-31 декабря 2015 г. | Методы построения информационных систем на основе автоматизированной содержательной обработки слабоструктурированных данных |
Результаты этапа: -- Разработаны методы поиска и визуального анализа текстовых данных социальных сетей -- Сформирован эффективный расчетный комплекс параллельной обработки сверхбольших массивов текстовой информации -- Разработаны методы аннотирования тональных отзывов об объектах разнообразной природы на основе автоматически извлекаемых заранее неизвестных аспектов | ||
3 | 1 января 2016 г.-31 декабря 2016 г. | Методы построения информационных систем на основе автоматизированной содержательной обработки слабоструктурированных данных |
Результаты этапа: -- Разработаны методы мониторинга информации социальных медиа -- Разработан двухэтапный метод выявления именованных сущностей, частичного учета местоименной референции -- Разработаны методы улучшения формирования интерпретируемых вероятностных тематических моделей |
Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".