Аннотация:В физике высоких энергий современные крупномасштабные распределенные вычислительные средыотвечают за обработку и анализ огромных объемов данных. Недавно объем хранилища общих данных ЦЕРН достиг впечатляющего 1 экзабайта. Это событие создало новые проблемы для системы управления рабочей нагрузкой, которая должна гарантировать, что ресурсы сбалансированы и данныеравномерно распределяется по сотням вычислительных центров в среде, позволяющей экономить ресурсы хранения. Для достижения этой цели спрос на данные должен учитывать популярность данных. В статье исследуются два подхода к прогнозированию популярности данных: регрессионные модели (LSTM, Facebook Prophet)для прогнозного анализа популярности групп наборов данных и моделей классификации (LSTM,FCN, MLP, логистическая регрессия, AdaBoost, CATBoost, XGBoost) за прогнозирование популярности