Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем - НИР | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Руководитель НИР: Машечкин И.В.
Ответственные исполнители: Казачук М.А., Попов И.С., Терехин А.Н.
Участники НИР: Васильев Ю.А., Герасимов С.В., Глазкова В.В., Горохов О.Е., Закляков Р.Д., Казачук М.А., Лазухин И.С., Мещеряков А.В., Петровский М.И., Попов И.С., Рыжов А.П., Тюляева В.В., Царёв Д.В., Чернов А.В., Шестимеров А.А.
Подразделение: Кафедра интеллектуальных информационных технологий
Срок исполнения: 1 января 2018 г. - 31 декабря 2027 г.
Номер договора (контракта, соглашения): 6.2.18
Номер ЦИТИС: АААА-А18-118011590152-8
Тип: Фундаментальная
Приоритетное направление научных исследований: Информационные технологии, компьютерные сети, распределенные вычисления и защита информации
Приоритеты и перспективы НТР Российской Федерации согласно Стратегии НТР РФ: переход к передовым цифровым, интеллектуальным технологиям
ПН России: Информационно-телекоммуникационные системы
Направление технологического прорыва России: Стратегические информационные технологии
Критическая технология России: Технологии и программное обеспечение распределенных и высокопроизводительных вычислительных систем
Рубрики ГРНТИ:
- 28.23.29 Программная реализация интеллектуальных систем
Классификатор OECD: Информатика – искусственный интеллект, Информатика – информационные системы
Ключевые слова: прогнозирование, covid-19, интеллектуальный анализ данных
covid-19, forecasting, survival models, mortality prediction models, data mining
Описание:
Проведение исследований, связанных с разработкой и применением инновационных технологий построения интеллектуальных программных систем
Abstract:
Conducting research related to the development and application of innovative technologies for building intelligent software systems
Планируемые результаты:
Дальнейшее проведение исследований с целью создания инновационных технологий построения интеллектуальных программных систем, предназначенных для решения аналитических и бизнес задач,принадлежащих различным предметным областям, а именно: • исследование и разработка новых алгоритмов и методов интеллектуального анализа предметноориентированных данных; • проведение экспериментов по построению функциональных прототипов компонентов специализированных интеллектуальных программных систем; • разработка и апробация технологий построения интеллектуальных программных систем.
Научный задел:
На кафедре проводятся исследования с целью создания инновационных технологий построения интеллектуальных программных систем, предназначенных для решения аналитических и бизнес задач, принадлежащих различным предметным областям, а именно: • исследование и разработка новых алгоритмов и методов интеллектуального анализа предметноориентированных данных; • проведение экспериментов по построению функциональных прототипов компонентов специализированных интеллектуальных программных систем; • разработка и апробация технологий построения интеллектуальных программных систем. Целевыми областями приложений могут являться: • компьютерная и информационная безопасность; • анализ текстовой информации; • анализ сложно структурированных данных большого объема; • поведенческая компьютерная биометрия; • разработка и внедрение программных технологий управления и анализа больших данных для прикладных систем поддержки принятия решений в различных приложениях.
Основные результаты:
В рамках исследовании задачи прогнозирования и анализа состояния технологического процесса: - cформулирована задача моделирования производственного процесса методами машинного обучения и поиска оптимального управления на основе полученных моделей. - исследовалась задача построения точных регрессионных моделей зависимости виртуальных датчиков от контроллеров, так как использующиеся в настоящее время - смоделировано поведение показателей качества во времени с учетом калибровки по реальным значениям показателей качества. Исследования проводились на реальных данных технологических процессов: - проведено экспериментальное исследование возможностей применения различных типов прогнозных моделей, включая линейные ARIMA, нейронные сети простой архитектуры (персептроны), современные нейронные сети глубинного обучения, методы на основе ансамблей деревьев решений, машины опорных векторов и другие. В результате был предложен - комбинированный подход, включающий методы предобработки и подготовки данных (нормализация, усреднение показателей исторических данных с учетом лага, кластеризация для выбора стабильных периодов работы, отбор значимых переменных и лагов с помощью ансамблей деревьев решений); - предложены методы построения прогнозных моделей с использованием нескольких типов персептронов (в том числе с оригинальными подходами по прогнозированию отклика и используемым целевым функциям); - показано, что применение сетей глубинного обучения уступает по качеству более простым нейросетевым моделям; -решена задача оптимального управления, поскольку за счет относительно простой формы прогнозирующих функций ее удалось свести к задаче условной оптимизации, где целевая функция и функции ограничений задаются формулами персептронов, которая, в свою очередь, успешно решается методом внутренней точки. Все исследования реализованы в виде экспериментального программного стенда, включающего набор утилит для построения моделей и АРМ применения моделей и поиска оптимального управления, с которым могут работать операторы реального технологического процесса. Исследовалась задача анализа поведения сетевых сообществ. В рамках задачи: - разработан математический аппарат, основанный на применении методов машинного обучения, предназначенный для выявления и анализа поведения сетевых сообществ. Проведены работы по исследованию и разработке математического и программного обеспечения динамической аутентификации пользователей на основе анализа их клавиатурного почерка. В результате: - предложен подход к подготовке данных, позволяющий строить информативное и стабильное по времени признаковое пространство (ключевые моменты - сокращение размерности пространства признаков путем выделения наиболее стабильных из них на основе расчета критерия Колмогорова-Смирнова и дискретизация признаков по квантилям); - предложены новые методы построения модели пользователя (нечеткий метод выявления аномалий в данных на основе эллиптической кластеризации (ESFC) в RKHS, метод на основе расчета метрики максимального отклонения, разработаны новые архитектуры полносвязных, рекуррентных и сверточных нейросетей); - разработан метод подбора оптимальных значений метапараметров алгоритмов одноклассовой классификации; - разработан метод оценки аномальности поведения пользователей на основе анализа целых сессий работы за компьютером с использованием t-статистики Уэлша; - разработана и реализована кросс-платформенная система динамической аутентификации пользователей по клавиатурному почерку. Проведенные на ее основе экспериментальные исследования подтвердили качество и обосновали достоверность полученных результатов. Проведены работы в области компьютерной безопасности с целью построения систем поведенческой биометрической аутентификации пользователей операционных систем. В рамках данных работ: - исследованы и доработаны алгоритмы построения биометрических образов и классификации при работе со стандартными устройствами ввода (клавиатура и мышь); - разработан оригинальный алгоритм подбора адаптивного порога классификации; - реализована система аутентификации пользователя по его биометрическому образу для операционных систем семейства Microsoft Windows. Система протестирована на соответствие поставленным требованиям, результаты подтверждены экспериментальным тестированием. Механизм биометрической аутентификации по клавиатуре может использоваться самостоятельно для защиты целевого компьютера, однако механизм аутентификации по мыши может использоваться только в качестве дополнительного фактора защиты, ввиду недостаточных показаний точности для использования в качестве самостоятельного фактора защиты. Проведены работы по методике разработки и реализации специального программного обеспечения специализированной системы хранения информации. Областью применения СПО СХИ являются автоматизированные рабочие места и серверы стационарного наземного комплекса приема и обработки изображений и мобильного наземного комплекса приема и обработки изображений. Проведены работы по разработке перспективных алгоритмов на основе сверточных нейронных сетей для детектирования объектов на рентгеновских изображениях В работе проведенной в 2019 году впервые исследовалось применение нейросетевых алгоритмов для детектирования астрономических объектов на рентгеновских изображениях и делается сравнение со стандартными методами поиска объектов в составе программного комплекса eSASS рентгеновского телескопа eRosita. Разработан нейросетевой алгоритм сегментации и детектирования рентгеновских источников на базе адаптированной нейронной сети U-Net. Проведены работы по разработке горизонтально-масштабируемых конвейеров обработки больших массивов астрономических данных на базе технологий Hadoop и Apache Spark. Разработан и протестирован прототип горизонтально-масштабируемого астрономического конвейера астрометрической калибровки изображений, коректность и масштабируемость предложенного програмного решения была подтверждена в ходе серии экспериментов на Spark-кластере в облачном сервисе Microsoft Azure. Проведены исследования и разработка алгоритмов машинного обучения для получения вероятностных оценок красных смещений рентгеновских источников на основе данных фотометрических обзоров неба.
Добавил в систему: Врагова Елена Юрьевна

Соисполнители НИР

МГУ имени М.В.Ломоносова

Координатор

Источник финансирования НИР

госбюджет, раздел 0110 (для тем по госзаданию)

Этапы НИР

#	Сроки	Название
1	1 января 2018 г.-31 декабря 2018 г.	Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа: На данном этапе были исследованы две задачи: - распознания с использованием мобильного устройства пользователя по походке; - распознавания пользователя по жесту с мобильным устройством в руке. В результате проведен поиск оптимального набора признаков, получаемых на основе данных, считываемых с мобильного устройства, исследована применимость методов анализа временных рядов в рамках данной задачи классификации. Проведен анализ достоинства и недостатки различных моделей представления данных, а также особенности применения их на практике, исследованы различные механизмы поиска исключений в рамках данной задачи. Проведена экспериментальная проверка алгоритмов и разработка оптимального решения.
2	1 января 2019 г.-31 декабря 2019 г.	Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа: В текущем году: 1. Исследовалась задача прогнозирования и анализа состояния технологического процесса. В рамках задачи: - cформулирована задача моделирования производственного процесса методами машинного обучения и поиска оптимального управления на основе полученных моделей. - смоделировано поведение показателей качества во времени с учетом калибровки по реальным значениям показателей качества. - проведено экспериментальное исследование возможностей применения различных типов прогнозных моделей, включая линейные ARIMA, нейронные сети простой архитектуры (персептроны), современные нейронные сети глубинного обучения, методы на основе ансамблей деревьев решений, машины опорных векторов и другие. В результате был предложен - комбинированный подход, включающий методы предобработки и подготовки данных (нормализация, усреднение показателей исторических данных с учетом лага, кластеризация для выбора стабильных периодов работы, отбор значимых переменных и лагов с помощью ансамблей деревьев решений); - предложены методы построения прогнозных моделей с использованием нескольких типов персептронов (в том числе с оригинальными подходами по прогнозированию отклика и используемым целевым функциям); 2. Исследовалась задача анализа поведения сетевых сообществ. В рамках задачи: - разработан математический аппарат, основанный на применении методов машинного обучения, предназначенный для выявления и анализа поведения сетевых сообществ. Разработанные методы позволяют осуществлять мониторинг сетевых сообществ, оценивать и анализировать их структуру. 3. Проведены работы по исследованию и разработке математического и программного обеспечения динамической аутентификации пользователей на основе анализа их клавиатурного почерка. - предложен подход к подготовке данных, позволяющий строить информативное и стабильное по времени признаковое пространство (ключевые моменты - сокращение размерности пространства признаков путем выделения наиболее стабильных из них на основе расчета критерия Колмогорова-Смирнова и дискретизация признаков по квантилям); - предложены новые методы построения модели пользователя (нечеткий метод выявления аномалий в данных на основе эллиптической кластеризации (ESFC) в RKHS, метод на основе расчета метрики максимального отклонения, разработаны новые архитектуры полносвязных, рекуррентных и сверточных нейросетей); - разработан метод подбора оптимальных значений метапараметров алгоритмов одноклассовой классификации; - разработан метод оценки аномальности поведения пользователей на основе анализа целых сессий работы за компьютером с использованием t-статистики Уэлша; - разработана и реализована кросс-платформенная система динамической аутентификации пользователей по клавиатурному почерку. Проведенные на ее основе экспериментальные исследования подтвердили качество и обосновали достоверность полученных результатов. 4. Проведены работы в области компьютерной безопасности с целью построения систем поведенческой биометрической аутентификации пользователей операционных систем. - исследованы и доработаны алгоритмы построения биометрических образов и классификации при работе со стандартными устройствами ввода (клавиатура и мышь); - разработан оригинальный алгоритм подбора адаптивного порога классификации; - реализована система аутентификации пользователя по его биометрическому образу для операционных систем семейства Microsoft Windows. Система протестирована на соответствие поставленным требованиям, результаты подтверждены экспериментальным тестированием. 5. Проведены работы по методике разработки и реализации специального программного обеспечения специализированной системы хранения информации. Областью применения СПО СХИ являются автоматизированные рабочие места и серверы стационарного наземного комплекса приема и обработки изображений и мобильного наземного комплекса приема и обработки изображений. СПО СХИ обеспечивает автоматизированное управление средствами оперативного хранения, создание резервных копий хранимых данных, возможность независимого выполнения операций планового архивирования потоков данных. 6.Проведены работы по разработке перспективных алгоритмов на основе сверточных нейронных сетей для детектирования объектов на рентгеновских изображениях.Разработан нейросетевой алгоритм сегментации и детектирования рентгеновских источников на базе адаптированной нейронной сети U-Net. 7.Проведены работы по разработке горизонтально-масштабируемых конвейеров обработки больших массивов астрономических данных на базе технологий Hadoop и Apache Spark.Рзработан и протестирован прототип горизонтально-масштабируемого астрономического конвейера астрометрической калибровки изображений, коректность и масштабируемость предложенного програмного решения была подтверждена в ходе серии экспериментов на Spark-кластере в облачном сервисе Microsoft Azure. 8.Проведены исследования и разработка алгоритмов машинного обучения для получения вероятностных оценок красных смещений рентгеновских источников на основе данных фотометрических обзоров неба.Рализованы методы вероятностных прогнозов фотометрических красных смещений на основе ансамблей деревьев решений и разнообразны метрики оценки прогнозов photo-z различных типов: точечных прогнозов, прогнозов доверительных интервалов, прогнозов полных распределений.
3	1 января 2020 г.-31 декабря 2020 г.	Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа: 1.Выполнены научно-исследовательские работы в области разработки методов искусственного интеллекта и анализа больших объемов данных, которые позволяют на основе реальных данных выявлять, визуализировать и применять для прогнозирования количественные зависимости между параметрами технологических процессов нефтепереработки, включая управляющие воздействия, наблюдаемые и контролируемые параметры. 2.Проведены исследования методов моделирования пользовательского поведения с помощью нейронных сетей для решения задач информационной безопасности. В рамках данной работы рассматривалась задача раннего обнаружения внутренних угроз информационной безопасности, вызванных вредоносными действиями пользователей (инсайдеров), которые имеют легитимный доступ к корпоративной сети. 3.Проведено исследование и разработка методов динамической аутентификации пользователей на основе анализа работы с компьютерной мышью. 4.Проведено исследование и разработка методов динамической аутентификации пользователей по динамике их работы с клавиатурой компьютера. 5.Проводено исследование и разработка методов обнаружения аномалий в сложно структурированных данных. 6.Проведено исследование и разработка методов обнаружения аномалий в потоках данных . 7.Проведено исследование, разработка и внедрение методов искусственного интеллекта и анализа больших объемов медицинских данных на основе предоставленных данных о развитии пандемиии COVID 19 в г. Москве. 8.Проведены исследования алгоритмов инкрементального моделирования (uplift modeling)с целью создания новых высокоточных алгоритмов. 9.Исследованы вероятностные модели машинного обучения для прогнозирования фотометрических расстояний до внегалактических источников в рентгеновских обзорах неба. 10.Проведены исследования по морфологической классификации астрономических изображений с помощью глубокого обучения в условиях ограниченной разметки.
4	1 января 2021 г.-31 декабря 2021 г.	Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа: В рамках поставленной задачи были исследованы следующие классы алгоритмов для моделирования технологического процесса во времени: • Методы на основе ансамблей деревьев (Градиентный бустинг, случайный лес); • Методы на основе машин опорных векторов (SVR); • Некоторые архитектуры нейронных сетей (CNN, MLP, LSTM). По результатам данного исследования было установлено, что наилучшие результаты в моделировании технологического процесса показывают простые модели с сильно сокращённой размерностью входа. Для поддержания представления системы в виде непостоянного, нефиксированного множества датчиков, а также в целях унификации, было принято решение использовать единую схему построения модели для каждой целевой/контролируемой переменной. Были предложены и подтверждены следующие подходы к предобработке данных: • Дублирование всех входов путем дифференцирования; • Разбиение входных данных на кластеры стабильности с использованием простых алгоритмов кластеризации; • Простое линейное масштабирование данных. Были предложены и подтверждены следующие подходы к формированию признакового пространства: • Формирование стандартного в задаче прогнозирования временных рядов признакового пространства. Каждый вектор-признак для данного шага во времени содержит историю показаний многомерного ряда за заданную величину лага. • Усреднение значений «старых» лагов для сокращения размерности пространства признаков. Для фильтрации и сортировки важных предикторов для векторов-признаков был предложен метод на основе использования ансамблей деревьев. В качестве единой основной модели предлагается использовать простую полносвязную сеть. Такой подход позволит нам в дальнейшем использовать несколько его преимуществ использования в рамках данной задачи: • Дообучение – было установлено, что наборы данных за разные промежутки времени могут обладать сильно различными статистическими показателями, что может сказаться на качестве модели. • Отсутствие требования к структурированности входных данных позволяет свободно использовать любые алгоритмы фильтрации векторов-признаков. • Данная модель просто выражается в виде математической формулы, что позволяет интерпретировать ее за пределами разработанной системы, а также исследовать как функцию, чем мы пользуемся при оптимизации. Для решения задачи оптимизации выходов предлагается использовать метод внутренней точки. Задача оптимизации решается или по выбору в каждой точке заданного набора данных, или последовательным применением модели с оптимизацией на несколько шагов. Оператору позволяется задать количество итераций метода. • Оптимизация избирательно в каждой точке предложенного дата сета и набора моделей с заданными весами • Оптимизация с последовательным применением моделей на несколько шагов с заданными весами в выбранной точке набора данных. • Поиск стабильного режима работы установки. В рамках исследования был построен экспериментальный программный стенд, содержащий следующие компоненты задачи моделирования технологического процесса: • Консольные утилиты построения разработанных моделей переменных установки. Статические и динамические модели системы. • Графическое приложение для применения построенных моделей к наборам данных, включающее описанный функционал для решения задачи оптимизации. В ходе исследования задачи построения регрессионных моделей виртуальных датчиков было обнаружено, что имеющихся в наличии данных (лабораторных оценок) по большей части типов исследований недостаточно для построения моделей с достаточной обобщающей способностью, либо данные не стационарны (имеют разные стат. характеристики в различные моменты времени). В связи с этим было решено отказаться от моделей, смотрящих в прошлое (слишком большие размерности пространства признаков с учетом ограниченности обучающей выборки) и использовать механизм ансамблирования с помощью кросс-валидации (каждая итоговая модель представляет из себя набор моделей, обученных на разных кусочках обучающей выборки). В отборе рекомендованных моделей помимо использования стандартных метрик качества был использован нестандартный эмпирический показатель «стабильность». По результатам экспериментов были рекомендованы наиболее точные стабильные модели, для различных типов лабораторных исследований типы методов регрессии различаются (для разных типов исследований отбирались как линейные, так и нелинейные методы типа GradientBoosting). Для задачи построения регрессионных моделей виртуальных датчиков был построен экспериментальный программный стенд, позволяющий как построить модели с заданными параметрами, так и визуализировать результаты их работы/сравнить модели между собой.
5	1 января 2022 г.-31 декабря 2022 г.	Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа: В рамках данного этапа работ были выполнены научно-исследовательские работы в области разработки методов искусственного интеллекта и анализа больших объемов данных для задач исследования технологических процессов. В процессе работ были развиты и пересмотрены подходы к построению прогнозных моделей, в том числе рассмотрена фильтрация, предложен новый алгоритм оптимизации, добавлен новый подход к рассмотрению отбора признаков и другие. Разработанные подходы позволяют: • На основе реальных данных выявлять, визуализировать и применять для прогнозирования количественные зависимости между параметрами технологических процессов нефтепереработки, включая управляющие воздействия, наблюдаемые и контролируемые параметры. • Прогнозировать значения контролируемых параметров процессов нефтепереработки в динамике в зависимости от предыдущих состояний процесса и управляющих воздействий. • Прогнозировать значения контролируемых и наблюдаемых параметров процессов нефтепереработки в статике в зависимости от управляющих воздействий без учета текущего состояния. • Использовать методы предобработки данных в части отбора значимых параметров и их лагов, установки параметров усреднения исторических значений параметров. • Управлять сложностью моделей как в части сложности получаемых функциональных зависимостей для наблюдаемых и контролируемых параметров, так и в части размера признакового пространства, т.е. числа важных входных параметров, их лагов, включать в модель конкретные параметры и их лаги, рекомендованные технологами. • Строить в том числе нелинейные статические (без зависимости от истории) и динамические (с историей) модели для реализации «виртуальных датчиков», позволяющих непрерывно во времени оценивать параметры качества процесса, калибруя модель на основе результатов реальных лабораторных исследований. • Решать задачу выбора оптимальных значений управляющих параметров с учетом текущего состояния (динамическая модель) и без (статическая модель) при заданных ограничениях на контролируемые переменные и параметры качества («виртуальные датчики»), когда целевая функция определена в виде линейной комбинации выходных параметров (в частности выходов продукта) с весовыми коэффициентами, заданными экспертно. • Строить последовательность управляющих воздействий с целью выхода на оптимальный режим при заданной линейной целевой функции по выходным параметрам. • Применять построенные модели к наборам реальных данных с известным откликом с целью визуализации, анализа качества построенных моделей и оценки правильности примененного управления. Работоспособность новых подходов Была продемонстрирована в рамках трех новых наборов данных. Так же, по результатам работ был реализован экспериментальный стенд, реализующий пользовательский интерфейс для разработанных подходов.
6	1 января 2023 г.-31 декабря 2023 г.	Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа: В рамках данного этапа работ были проведены научно-исследовательские работы в области исследования и разработки методов искусственного интеллекта и анализа больших данных в сфере здравоохранения. Решены все поставленные задачи: • Проведены анализ и обработка предоставленных исторических данных о развитии пандемии Covid-19 в г. Москве; • На основе подготовленных данных осуществлена разработка моделей выживаемости для прогнозирования тяжести течения и исхода заболевания у пациентов, в частности: - моделей выживаемости с использованием методов Каплана-Мейера и пропорциональных рисков Кокса с выявлением ключевых признаков, влияющих на выживаемость, а также выявлением стратифицирующих признаков; - моделей выживаемости с учетом стратифицирующих признаков на основе использования методов Каплана-Мейера с выявлением важных предикторов внутри каждой из страт. За отчетный период опубликовано 5 научных статей в журналах, индексируемых WoS/Scopus/RSCI, а также получен 1 патент на изобретение.
7	1 января 2024 г.-31 декабря 2024 г.	Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа:
8	1 января 2025 г.-31 декабря 2025 г.	Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа:
9	1 января 2026 г.-31 декабря 2026 г.	Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа:

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".

	ИСТИНА	Войти в систему Регистрация
	ИСТИНА ИНХС РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИСТИНА ИНХС РАН

Исследование, разработка и применение инновационных технологий построения интеллектуальных программных системНИР

Research, development and application of innovative technologies of building intelligent software systems

Соисполнители НИР

Источник финансирования НИР

Этапы НИР

Прикрепленные к НИР результаты

Прикрепленные файлы