Архитектура программной системы для сбора и анализа информации о коммуникационной среде вычислительного кластерастатья

Работа с статьей


[1] Архитектура программной системы для сбора и анализа информации о коммуникационной среде вычислительного кластера / А. Н. Сальников, И. А. Мунькин, П. С. Банников, А. И. Майсурадзе // Параллельные вычислительные технологии – XI международная конференция, ПаВТ'2017, г. Казань, 3–7 апреля 2017. — Издательский центр ЮУрГУ Челябинск, 2017. — С. 533–533. Авторы предлагают подход, когда в определенный момент времени весь вычислительный кластер или какая-то его часть подвергаются специальному тестированию, в процессе которого измеряются задержки передачи данных в различных режимах. Цель проведенного тестирования - уточнить структуру задержек, чтобы полуавтоматически обнаружить аномалии в коммуникациях, тем самым дать полезный инструмент для балансировки нагрузки в параллельных программах, для решения задачи назначений вычислений на узлы вычислительного кластера, а также дать инструмент системным администраторам для выявления несоответствий спецификации производителя вследствие некорректной работы оборудования или изменившихся условий эксплуатации всей системы целиком. Наработки авторов собраны в проект с открытым исходным кодом HPC cluster benchmarking toolkit, или сокращенно clustbench.

Публикация в формате сохранить в файл сохранить в файл сохранить в файл сохранить в файл сохранить в файл сохранить в файл скрыть