Аннотация:В дипломной работе рассматриваются два нелинейных метода понижения размерности (или, лучше сказать, два нелинейных метода вложения набора точек многомерного пространства в двумерное или трехмерное пространство) – UMAP и tSNE.
По сути работа состоит из двух частей – вводной и основной. Во вводной части кратко объясняются принципы работы рассматриваемых методов. В основной части описывается вычислительный эксперимент, в котором изучается влияние основных гиперпраметров на результат работы UMAP и tSNE.
Ключевой вывод, который удалось сделать на основе результатов вычислительного эксперимента, заключается в том, что при низких значениях для количества ближайших соседей (в UMAP) или перплексии (в tSNE) глобальная структура данных после вложения в пространство малой размерности значительно искажается; в то же время, увеличение этих параметров после определенного порога увеличивает вычислительную сложность, но не приводит к дальнейшему улучшению в сохранении этой глобальной структуры.