Исследование, разработка и применение инновационных технологий построения интеллектуальных программных системНИР

Research, development and application of innovative technologies of building intelligent software systems

Соисполнители НИР

МГУ имени М.В.Ломоносова Координатор

Источник финансирования НИР

госбюджет, раздел 0110 (для тем по госзаданию)

Этапы НИР

# Сроки Название
1 1 января 2018 г.-31 декабря 2018 г. Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа: На данном этапе были исследованы две задачи: - распознания с использованием мобильного устройства пользователя по походке; - распознавания пользователя по жесту с мобильным устройством в руке. В результате проведен поиск оптимального набора признаков, получаемых на основе данных, считываемых с мобильного устройства, исследована применимость методов анализа временных рядов в рамках данной задачи классификации. Проведен анализ достоинства и недостатки различных моделей представления данных, а также особенности применения их на практике, исследованы различные механизмы поиска исключений в рамках данной задачи. Проведена экспериментальная проверка алгоритмов и разработка оптимального решения.
2 1 января 2019 г.-31 декабря 2019 г. Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа: В текущем году: 1. Исследовалась задача прогнозирования и анализа состояния технологического процесса. В рамках задачи: - cформулирована задача моделирования производственного процесса методами машинного обучения и поиска оптимального управления на основе полученных моделей. - смоделировано поведение показателей качества во времени с учетом калибровки по реальным значениям показателей качества. - проведено экспериментальное исследование возможностей применения различных типов прогнозных моделей, включая линейные ARIMA, нейронные сети простой архитектуры (персептроны), современные нейронные сети глубинного обучения, методы на основе ансамблей деревьев решений, машины опорных векторов и другие. В результате был предложен - комбинированный подход, включающий методы предобработки и подготовки данных (нормализация, усреднение показателей исторических данных с учетом лага, кластеризация для выбора стабильных периодов работы, отбор значимых переменных и лагов с помощью ансамблей деревьев решений); - предложены методы построения прогнозных моделей с использованием нескольких типов персептронов (в том числе с оригинальными подходами по прогнозированию отклика и используемым целевым функциям); 2. Исследовалась задача анализа поведения сетевых сообществ. В рамках задачи: - разработан математический аппарат, основанный на применении методов машинного обучения, предназначенный для выявления и анализа поведения сетевых сообществ. Разработанные методы позволяют осуществлять мониторинг сетевых сообществ, оценивать и анализировать их структуру. 3. Проведены работы по исследованию и разработке математического и программного обеспечения динамической аутентификации пользователей на основе анализа их клавиатурного почерка. - предложен подход к подготовке данных, позволяющий строить информативное и стабильное по времени признаковое пространство (ключевые моменты - сокращение размерности пространства признаков путем выделения наиболее стабильных из них на основе расчета критерия Колмогорова-Смирнова и дискретизация признаков по квантилям); - предложены новые методы построения модели пользователя (нечеткий метод выявления аномалий в данных на основе эллиптической кластеризации (ESFC) в RKHS, метод на основе расчета метрики максимального отклонения, разработаны новые архитектуры полносвязных, рекуррентных и сверточных нейросетей); - разработан метод подбора оптимальных значений метапараметров алгоритмов одноклассовой классификации; - разработан метод оценки аномальности поведения пользователей на основе анализа целых сессий работы за компьютером с использованием t-статистики Уэлша; - разработана и реализована кросс-платформенная система динамической аутентификации пользователей по клавиатурному почерку. Проведенные на ее основе экспериментальные исследования подтвердили качество и обосновали достоверность полученных результатов. 4. Проведены работы в области компьютерной безопасности с целью построения систем поведенческой биометрической аутентификации пользователей операционных систем. - исследованы и доработаны алгоритмы построения биометрических образов и классификации при работе со стандартными устройствами ввода (клавиатура и мышь); - разработан оригинальный алгоритм подбора адаптивного порога классификации; - реализована система аутентификации пользователя по его биометрическому образу для операционных систем семейства Microsoft Windows. Система протестирована на соответствие поставленным требованиям, результаты подтверждены экспериментальным тестированием. 5. Проведены работы по методике разработки и реализации специального программного обеспечения специализированной системы хранения информации. Областью применения СПО СХИ являются автоматизированные рабочие места и серверы стационарного наземного комплекса приема и обработки изображений и мобильного наземного комплекса приема и обработки изображений. СПО СХИ обеспечивает автоматизированное управление средствами оперативного хранения, создание резервных копий хранимых данных, возможность независимого выполнения операций планового архивирования потоков данных. 6.Проведены работы по разработке перспективных алгоритмов на основе сверточных нейронных сетей для детектирования объектов на рентгеновских изображениях.Разработан нейросетевой алгоритм сегментации и детектирования рентгеновских источников на базе адаптированной нейронной сети U-Net. 7.Проведены работы по разработке горизонтально-масштабируемых конвейеров обработки больших массивов астрономических данных на базе технологий Hadoop и Apache Spark.Рзработан и протестирован прототип горизонтально-масштабируемого астрономического конвейера астрометрической калибровки изображений, коректность и масштабируемость предложенного програмного решения была подтверждена в ходе серии экспериментов на Spark-кластере в облачном сервисе Microsoft Azure. 8.Проведены исследования и разработка алгоритмов машинного обучения для получения вероятностных оценок красных смещений рентгеновских источников на основе данных фотометрических обзоров неба.Рализованы методы вероятностных прогнозов фотометрических красных смещений на основе ансамблей деревьев решений и разнообразны метрики оценки прогнозов photo-z различных типов: точечных прогнозов, прогнозов доверительных интервалов, прогнозов полных распределений.
3 1 января 2020 г.-31 декабря 2020 г. Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа: 1.Выполнены научно-исследовательские работы в области разработки методов искусственного интеллекта и анализа больших объемов данных, которые позволяют на основе реальных данных выявлять, визуализировать и применять для прогнозирования количественные зависимости между параметрами технологических процессов нефтепереработки, включая управляющие воздействия, наблюдаемые и контролируемые параметры. 2.Проведены исследования методов моделирования пользовательского поведения с помощью нейронных сетей для решения задач информационной безопасности. В рамках данной работы рассматривалась задача раннего обнаружения внутренних угроз информационной безопасности, вызванных вредоносными действиями пользователей (инсайдеров), которые имеют легитимный доступ к корпоративной сети. 3.Проведено исследование и разработка методов динамической аутентификации пользователей на основе анализа работы с компьютерной мышью. 4.Проведено исследование и разработка методов динамической аутентификации пользователей по динамике их работы с клавиатурой компьютера. 5.Проводено исследование и разработка методов обнаружения аномалий в сложно структурированных данных. 6.Проведено исследование и разработка методов обнаружения аномалий в потоках данных . 7.Проведено исследование, разработка и внедрение методов искусственного интеллекта и анализа больших объемов медицинских данных на основе предоставленных данных о развитии пандемиии COVID 19 в г. Москве. 8.Проведены исследования алгоритмов инкрементального моделирования (uplift modeling)с целью создания новых высокоточных алгоритмов. 9.Исследованы вероятностные модели машинного обучения для прогнозирования фотометрических расстояний до внегалактических источников в рентгеновских обзорах неба. 10.Проведены исследования по морфологической классификации астрономических изображений с помощью глубокого обучения в условиях ограниченной разметки.
4 1 января 2021 г.-31 декабря 2021 г. Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа: В рамках поставленной задачи были исследованы следующие классы алгоритмов для моделирования технологического процесса во времени: • Методы на основе ансамблей деревьев (Градиентный бустинг, случайный лес); • Методы на основе машин опорных векторов (SVR); • Некоторые архитектуры нейронных сетей (CNN, MLP, LSTM). По результатам данного исследования было установлено, что наилучшие результаты в моделировании технологического процесса показывают простые модели с сильно сокращённой размерностью входа. Для поддержания представления системы в виде непостоянного, нефиксированного множества датчиков, а также в целях унификации, было принято решение использовать единую схему построения модели для каждой целевой/контролируемой переменной. Были предложены и подтверждены следующие подходы к предобработке данных: • Дублирование всех входов путем дифференцирования; • Разбиение входных данных на кластеры стабильности с использованием простых алгоритмов кластеризации; • Простое линейное масштабирование данных. Были предложены и подтверждены следующие подходы к формированию признакового пространства: • Формирование стандартного в задаче прогнозирования временных рядов признакового пространства. Каждый вектор-признак для данного шага во времени содержит историю показаний многомерного ряда за заданную величину лага. • Усреднение значений «старых» лагов для сокращения размерности пространства признаков. Для фильтрации и сортировки важных предикторов для векторов-признаков был предложен метод на основе использования ансамблей деревьев. В качестве единой основной модели предлагается использовать простую полносвязную сеть. Такой подход позволит нам в дальнейшем использовать несколько его преимуществ использования в рамках данной задачи: • Дообучение – было установлено, что наборы данных за разные промежутки времени могут обладать сильно различными статистическими показателями, что может сказаться на качестве модели. • Отсутствие требования к структурированности входных данных позволяет свободно использовать любые алгоритмы фильтрации векторов-признаков. • Данная модель просто выражается в виде математической формулы, что позволяет интерпретировать ее за пределами разработанной системы, а также исследовать как функцию, чем мы пользуемся при оптимизации. Для решения задачи оптимизации выходов предлагается использовать метод внутренней точки. Задача оптимизации решается или по выбору в каждой точке заданного набора данных, или последовательным применением модели с оптимизацией на несколько шагов. Оператору позволяется задать количество итераций метода. • Оптимизация избирательно в каждой точке предложенного дата сета и набора моделей с заданными весами • Оптимизация с последовательным применением моделей на несколько шагов с заданными весами в выбранной точке набора данных. • Поиск стабильного режима работы установки. В рамках исследования был построен экспериментальный программный стенд, содержащий следующие компоненты задачи моделирования технологического процесса: • Консольные утилиты построения разработанных моделей переменных установки. Статические и динамические модели системы. • Графическое приложение для применения построенных моделей к наборам данных, включающее описанный функционал для решения задачи оптимизации. В ходе исследования задачи построения регрессионных моделей виртуальных датчиков было обнаружено, что имеющихся в наличии данных (лабораторных оценок) по большей части типов исследований недостаточно для построения моделей с достаточной обобщающей способностью, либо данные не стационарны (имеют разные стат. характеристики в различные моменты времени). В связи с этим было решено отказаться от моделей, смотрящих в прошлое (слишком большие размерности пространства признаков с учетом ограниченности обучающей выборки) и использовать механизм ансамблирования с помощью кросс-валидации (каждая итоговая модель представляет из себя набор моделей, обученных на разных кусочках обучающей выборки). В отборе рекомендованных моделей помимо использования стандартных метрик качества был использован нестандартный эмпирический показатель «стабильность». По результатам экспериментов были рекомендованы наиболее точные стабильные модели, для различных типов лабораторных исследований типы методов регрессии различаются (для разных типов исследований отбирались как линейные, так и нелинейные методы типа GradientBoosting). Для задачи построения регрессионных моделей виртуальных датчиков был построен экспериментальный программный стенд, позволяющий как построить модели с заданными параметрами, так и визуализировать результаты их работы/сравнить модели между собой.
5 1 января 2022 г.-31 декабря 2022 г. Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа:
6 1 января 2023 г.-31 декабря 2023 г. Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа:
7 1 января 2024 г.-31 декабря 2024 г. Исследование, разработка и применение инновационных технологий построения интеллектуальных программных систем
Результаты этапа:

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".