Описание:В последнее годы всё активнее используются интеллектуальный анализ данных (data mining), который представляют собой процесс выявления характерных образцов, внутренних связей и закономерностей в множестве данных. Широкое применение фиксации видео и звуковых сигналов, расширение социальной активности в Интернет привели к существенному изменению структуры и объёма подлежащей обработке информации. Сформировалось новое направление, называемое «Большие данные» (Big Data). Высокие темпы роста объемов данных, поступающих в реальном времени и накапливаемых в специальных хранилищах, ужесточение требований к оперативности принятия решений обуславливают необходимость использования высокопроизводительной вычислительной техники и высокоскоростных методов обработки данных. Курс посвящен вопросам практического применения интеллектуального анализа больших объёмов данных. В лекционной части курса формулируются основные задачи разведочного анализа данных, анализа образов, кластеризации и классификации, прогнозирования, излагаются соответствующие методы машинного обучения и статистики, включая метод опорных векторов, многомерный анализ данных, методы работы со сложными графами и нейронным сетям, методы хранения и извлечения данных, изучаются современная методика анализа производительности программ и приёмы их распараллеливания по технологиям OpenMP, MPI, CUDA, OpenCL, даётся обзор коммерческих и свободно распространяемых систем data mining и инструментария Big Data. В семинарской части курса разбираются примеры компьютерных программ на языках С++ и Fortran 2008, реализующих алгоритмы data mining. Слушателям предлагается проанализировать возможность ускорения работы программ, разработать под руководством преподавателей параллельные алгоритмы, внести соответствующие модификации в программы и провести методические расчёты по анализу их ускорения и эффективности.
Основная цель курса – подготовка слушателей к самостоятельной разработке и применению высокоэффективных вычислительных алгоритмов для использования при решении задач интеллектуального анализа данных в естественных науках, военном деле, экономике, медицине, психологии, социологии и в других областях.