- PVSM.RU - https://www.pvsm.ru -
У нас прошла ровно половина курса “Управление инженерной инфраструктурой дата-центра” [1]. Так получалось, что определенные темы звучали почти на каждом семинаре, – не важно, рассказывали мы нашим слушателям про подготовку дата-центра к лету, работу с подрядчиками или выстраивание собственной службой эксплуатации. Мы решили собрать небольшой гайд по самым животрепещущим темами и рекомендациям из нашего опыта.

Эта тема – рекордсмен по упоминаниям в наших семинарах. О маркировке нужно знать следующее:
Для распределительных щитов принцип может быть следующим: тип щита, зал, луч, номер щита. Тогда инженеру будет понятно, что ЩР2.2.1 – это распределительный щит номер 1, запитанный от второго луча, во втором зале.

Маркировка трубопроводов водяного контура холодоснабжения NORD-4. На каждой из труб обозначен номер, направление подачи и температура воды (теплая или холодная).
Дата-центр или серверную любых размеров сложно эксплуатировать и обслуживать без системы мониторинга. Нет мониторинга – нет информации, а значит дата-центром или серверной придется управлять вслепую.
Наша рекомендация по джентльменскому набору для мониторинга следующие. Отслеживайте:
Когда программа минимум выполнена, можно дополнительно добавить:
На 80-м lvl мониторинга уже отслеживается работа элементов внутри оборудования. Например: с какой скоростью крутится вентилятор внешнего блока, какое давление в фреоновой системе или на сколько процентов сейчас загружен компрессор в чиллере. В дальнейшем это поможет понять, есть ли резерв у оборудования (не работает ли оно на 100% от своей мощности), отследить потенциальную проблему и проанализировать работу систем в разных условиях.
Большое количество отслеживаемых параметров – еще не показатель качества работы мониторинга. Все должно быть еще и правильно настроено. Вот основные заветы:

Принципиальная схема дата-центра NORD-3 в системе мониторинга позволяет быстро оценить состояние энергоцентра, температуры в холодных коридорах машинного зала.

Дежурные инженеры следят за работой NORD-3 в центре управления и мониторинга.
Это совсем опционально, но так как мы коммерческий дата-центр, то для своих клиентов мы настроили трансляцию всех основных показателей в Личный кабинет и мобильное приложение DL Monitor.
Все параметры нужно не только наблюдать в режиме реального времени, но и собирать по ним статистику. В будущем это поможет лучше понять, как ведет себя оборудование в течение жизненного цикла, как часто необходим ремонт, есть ли запас по мощности. Это поможет спланировать периодичность техобслуживания, оценить необходимое количество ЗИП, сформировать бюджет на закупку и обслуживание оборудования [2].
Как это работает? Например, у нас есть долгосрочная статистика по кондиционированию и информация о метеоусловиях (на каждой нашей площадке работает метеостанция). Мы можем проследить, как работала система охлаждения прошлым летом в +32 °С. Если ожидается жаркое лето, то мы сможем оценить, есть ли у системы холодоснабжения запас по мощности или нужно как-то ее усиливать. Также из истории поломок и ремонтов мы можем спрогнозировать, какие запасные детали скорее всего понадобятся.
Для ведения такой статистики не нужны специализированные программы. Единственный совет: удобнее работать с системой мониторинга, которая умеет строить графики. Там, где информация не подразумевает отображения в виде графиков (например, содержание инцидентов, ремонтов, аварий и ТО), можно занести данные в обычный Excel.
Вот как может выглядеть сводная таблица для ДГУ. Проставьте активные ссылки на информацию по договору, гарантийному обслуживанию, графику ТО, ремонтам, тестовым запускам и инструкциям, и вся информация по конкретному ДГУ всегда будет под рукой.

ЗИП и расходники всегда должны быть под рукой. Если есть возможность хранить их рядом с серверной, то это идеальный вариант. Если с местом под склад туго, то можно поручить подрядчику хранение и предоставление ЗИП по запросу.
Что нужно иметь про запас из ЗИП и расходников для срочных ремонтов:
Доступными должны быть и долгоедующие запасные части (компрессоры, контроллеры, вводные автоматы ГРЩ), чтобы дата-центр не оставался без необходимого резерва.

Склад ЗИП для системы кондиционирования.
Про правильную установку оборудования у нас было отдельное занятие [3], но про частые ошибки мы вспоминаем почти на каждом семинаре. Почему? Все просто. Неправильно установленный сервер в стойке может вызвать локальные проблемы даже в отлично спроектированном дата-центре с грамотной службой эксплуатации.
Вот основные ошибки:

Правильная схема подключения серверов с одним и двумя блоками питания.
На этом завершаем наш хит-парад животрепещущих тем для инженера эксплуатации. Делитесь в комментариях своими наблюдениями, задавайте вопросы. На ближайшем семинаре [4] будем рассказывать, как тестировать инженерные системы дата-центра и как выстроить систему мониторинга.
Еще статьи про устройство и эксплуатацию дата-центров:
» Как создавалась система холодоснабжения дата-центра NORD-4 [5]
» Ошибки в проекте дата-центра, которые вы ощутите только на этапе эксплуатации [6]
» Путь электричества в дата-центре [7]
» Экскурсия по самом большому дата-центру в России [8]
Автор: DataLine
Источник [9]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/it-infrastruktura/212970
Ссылки в тексте:
[1] “Управление инженерной инфраструктурой дата-центра”: http://uni.dtln.ru/courses
[2] бюджет на закупку и обслуживание оборудования: http://uni.dtln.ru/courses/upravlenie-inzhenernoy-infrastrukturoy-cod/skolko-stoit-ekspluataciya-cod
[3] отдельное занятие: https://habrahabr.ru/company/dataline/blog/193914/
[4] ближайшем семинаре: http://uni.dtln.ru/courses/upravlenie-inzhenernoy-infrastrukturoy-cod/testirovaniya-i-monitoring
[5] Как создавалась система холодоснабжения дата-центра NORD-4: https://habrahabr.ru/company/dataline/blog/314730/
[6] Ошибки в проекте дата-центра, которые вы ощутите только на этапе эксплуатации: https://habrahabr.ru/company/dataline/blog/311826/
[7] Путь электричества в дата-центре: https://habrahabr.ru/company/dataline/blog/310356/
[8] Экскурсия по самом большому дата-центру в России: https://habrahabr.ru/company/dataline/blog/309520/
[9] Источник: https://habrahabr.ru/post/315892/?utm_source=habrahabr&utm_medium=rss&utm_campaign=best
Нажмите здесь для печати.