ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ИНХС РАН |
||
Работа посвящена статистическому анализу структуры γ-семейств, зарегистрированных в эксперименте «Памир», который проводился с целью изучения взаимодействий адронов космических лучей сверхвысоких энергий с ядрами воздуха методом рентгеноэмульсионных камер (РЭК) на высоте 4400 м. Г-семейства представляют собою узкие группы высокоэнергичных γ-квантов и электронов (частиц), которые образуются в результате развития ядерно-электромагнитного каскада (ЯЭК) в атмосфере Земли, инициированного первичными частицами космических лучей (протонами и более тяжелыми ядрами). При энергии частиц выше 4 ТэВ, они оставляют пятна почернений на рентгеновской пленке РЭК. При анализе эксперимента также использовалась база данных искусственных событий, наигранных методом Монте-Карло на основе феноменологической модели сильных взаимодействий МС0. Задача данного исследования состоит в попытке объединения продуктов отдельных последних сильных взаимодействий ЯЭК, непосредственно вносящих вклад в рассматриваемое семейство, в самостоятельные более узкие структурные единицы – кластеры, составляющие данное семейство. С целью упрощения задачи мы искали наилучшие алгоритмы кластеризации как для всех модельных семейств, т.е. для всех типов первичных частиц и во всем широком диапазоне суммарных энергий, так и разбивая семейства на группы по типу первичной частицы. Для того, чтобы убедится в возможности переноса результатов анализа структуры модельных γ-семейств на экспериментальные события, было проведено исследование однородности экспериментальных и модельных данных, методами статистической проверки гипотез о совпадении распределений по наблюдаемым характеристикам семейств. Гипотезы об однородности распределений по суммарной энергии, среднему радиусу <R>, среднему <ER>, множественности nγ и пр. подтвердились в широком диапазоне энергий Примененные программы 2D и 3D визуализации семейств в форматах png и html позволили существенно облегчить поиск оптимальных алгоритмов кластеризации. Были рассмотрены алгоритмы кластеризации с неизвестным числом кластеров NC (Agglomerative clustering, DBSCAN и т.д.) и итеративные алгоритмы с подбором NC (PAM, fastkmed, skm, алгоритм нечёткой кластеризации cmeans). Для выбора наилучших алгоритмов кластеризации, помимо формальных функционалов качества кластеризации, были введены физические коэффициенты качества: чистота, фрагментарность, целостность и эффективность. В случае алгоритмов с неизвестным числом кластеров предложен метод определения параметра наилучшей кластеризации. При помощи найденных параметров кластеризации проведено сравнение алгоритмов кластеризации по различным группам частиц. Для итеративных алгоритмов применялась программная библиотека языка R NbClust, определяющая оптимальное число кластеров рассматриваемого семейства. Для каждого типа первичных частиц при одинаковом алгоритме кластеризации (PAM) была установлена своя оптимальная метрика, которая отличается от метрики, найденной в «идеальном» случае.