Аннотация:Рассматривается задача наукометрического исследования научных публикаций, выполняемых в рамках грантовых программ, поддержанных DARPA и IARPA – государственными агентствами поддержки прорывных исследований США.
Актуальность задачи определяется тем, что исследования в рамках грантовых про-грамм DARPA и IARPA на практике часто задают направления научных исследований для всего мира. Проведение собственных прорывных исследований требует больших капиталовложений, поэтому представляет интерес оперативный мониторинг результатов поисковых исследований, с тем чтобы оптимизировать собственные расходы, ориентируясь толь-ко на оправдавшие себя исследования.
Сама по себе такая постановка задачи является поисковой. Требовалось решить комплекс задач – определить перечень необходимых публикаций, собрать информацию о публикациях, провести анализ с нечетко заданными критериями.
Разработано программное обеспечение, которое в автоматическом режиме, используя глобальный сервис Google Scholar, может собирать информацию о публикациях в рамках грантовых программ (используется такая малоиспользуемая зона научных публикаций как «Благодарности»).
Также было разработано программное обеспечения извлечения из поисковой выдачи и документов публикаций текстовой информации и метаданных.
Для анализа текстовой информации использовалась методология вероятностных тематических моделей, что обусловлено тем, что для новых направлений исследований не существует достаточного покрытия онтологическими ресурсами.
Сформированы входные данные для проведения анализа накопленных данных на графах когнитивных схем (с использованием специального программного обеспечения визуализации когнитивных схем, предоставленном лабораторией анализа информационных ресурсов НИВЦ МГУ).
Проведен анализ когнитивных схем различных комбинаций срезов данных: грантовых программ, авторов, публикаций, вероятностных тематик, лексики вероятностных тематик.