- PVSM.RU - https://www.pvsm.ru -
Я ведущий инженер компании «ЛАНИТ-Интеграция [1]». Работаю здесь больше 20 лет. Последние семь лет занимаюсь инженерным обеспечением ЦОДов: устанавливаю и запускаю оборудование в работу.
С каждым годом появляется всё больше требований к надежности и удобству использования дата-центров. Однако этого нельзя добиться, если сосредоточиться только на резервных копиях систем и качестве отдельных элементов. На рынке понимают эту простую мысль, поэтому компании всё чаще внедряют единую систему мониторинга. Если коротко, она следит за инженерной инфраструктурой ЦОД и помогает избежать аварийных ситуаций.
В статье я расскажу о готовых программно-аппаратных решениях мониторинга, которые мы с коллегами используем в проектах.
Источник [2]
Для начала расскажу о том, из чего состоит основа центра обработки данных. Её разделяют на три составляющих.
Инженерная инфраструктура дата-центров тоже делится на две подсистемы: функционирования и безопасности. Первая включает системы общего, гарантированного и бесперебойного электроснабжения, технологического кондиционирования, монтажные конструктивы. В подсистему безопасности входят охранно-пожарная сигнализация, системы автономного газового пожаротушения, видеонаблюдения, контроля и управления доступом.
Для уверенности, что все системы работают в штатном режиме, нужен постоянный контроль, который и даёт мониторинг.
Источник [3]
Мониторинг помогает инженерам, обслуживающим ЦОД, комфортнее работать. Без него специалисты должны либо жить и трудиться всё время рядом со шкафами, либо выходить из кабинета и бежать к ним каждый раз, когда возникла какая-то проблема или есть подозрения, что она может случиться.
Источник [4]
Мониторинг в реальном времени показывает, как работает инфраструктура ЦОД. За показателями, как правило, следит дежурная смена. При возникновении отклонения или нештатной ситуации сотрудники дежурной смены могут вовремя предотвратить критическую ситуацию или же свести её последствия к минимуму. Также система мониторинга собирает данные о параметрах, статусе оборудования, следит за сроками сервисного обслуживания, наработанными часами и т.д.
Что именно контролирует система мониторинга и какие задачи решает?
К сожалению, статистика говорит, что множество аварийных ситуаций с техникой возникает по вине человека. Именно поэтому мониторинг в том числе следит не только за параметрами, но и за теми, кто имеет доступ к ЦОД и кто/что в нем делает.
По типу реализации системы делятся на программные, аппаратные и гибридные решения.
По уровню контроля системы мониторинга делятся на распределенные и централизованные.
Распределенные системы позволяют отслеживать состояние одного или нескольких однотипных устройств.
Централизованные системы дают возможность объединить всё контролируемое оборудование, в том числе и несколько распределенных систем, в единую систему, позволяющую наблюдать за работой всего оборудования в «одном окне».
Источник [5]
Уже много лет мы с коллегами работаем с системой мониторинга NetBotz и системой управления инфраструктурой ЦОД StruxureWare Data center Expert от APC by Schneider Electric. У нашей команды есть партнёрская сертификация направления DCIM.
У большинства производителей инженерного оборудования существуют комплексные решения. С их помощью можно создать инженерную инфраструктуру ЦОД «под ключ» и собрать систему мониторинга «из кубиков».
Это:
Однако у готовых систем есть и минусы. Как правило, каждый производитель предлагает систему мониторинга своего оборудования, то есть того, которое производит сам. Конечно, очень удобно, когда инфраструктура ЦОД строится на оборудовании одного бренда. Внедрение такой системы занимает мало времени, нет проблемы с подключением и распознаванием параметров оборудования.
Источник [6]
Предсказуемо, что главная проблема таких систем — это подключение оборудования сторонних производителей. Бывает, что такие системы поддерживают некоторые типы и модели оборудования сторонних производителей, но для корректного подключения и отображения параметров очень часто требуются дополнительные действия и время.
Например для подключения устройств других брендов, подключаемых по протоколу MODBUS [7] к системе Data center Expert от APC, не входящих в список поддерживаемого, приходиться обращаться в службу поддержки. При этом нужно предоставить технические данные на подключаемое оборудование, заполнить несколько форм и подождать около месяца. Своими силами это сделать практически невозможно.
От теории к практике. Первую систему мониторинга мы установили в 2010 году. Всего мы реализовали более 15 систем мониторинга ЦОД. С одной стороны, работа каждый раз одинакова, с другой стороны, у каждого заказчика свои условия и требования, поэтому каждый проект запоминается чем-то своим. Ниже я расскажу о самых интересных проектах за последние несколько лет.
Два центра обработки данных находились в Москве и в Санкт-Петербурге. Их связали единой системой мониторинга инженерной инфраструктуры. В этом проекте впервые пришлось разделять права пользователей для доступа к группам устройств. Как это? Специалисты из Москвы контролировали все устройства в обоих ЦОД, а специалисты в Санкт-Петербурге контролировали только свою часть оборудования.
Нашей команде впервые пришлось «прикручивать» к системе мониторинга StruxureWare Data center Expert оборудование сторонних производителей, дизель-генераторную установку, щит автоматики и щит управления системой кондиционирования. Не обошлось без помощи западных специалистов службы поддержки производителя системы мониторинга. Они за месяц написали драйверы для нужных нам устройств.
Здесь помимо стандартного решения мы впервые реализовали мониторинг щита вводного распределительного устройства с автоматическими рубильниками, управляемого программируемым реле ZelioLogic, щита распределения питания с контролем состояния автоматических выключателей на контроллере Acti-9 SmartLink и счетчиков электроэнергии PowerLogic от компании Schneider Electric.
Мы впервые в стране реализовывали системы мониторинга и системы управления инфраструктурой ЦОД с применением 190 беспроводных датчиков температуры и влажности, расположенными в 6 машинных залах и 4 аппаратных.
Относительно скоро стартует ещё один крупный проект. Для нас это будет новый опыт. Предстоит внедрять системы мониторинга RAMOS и систему управления инфраструктурой ЦОД Aegis DCIM (чешский производитель CONTEG). Возможно, снова появится повод, о чём вам рассказать.
Кстати, наша команда всегда ищет талантливых и увлеченных профессионалов.
Автор: data_center_master
Источник [8]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/inzhenerny-e-sistemy/298179
Ссылки в тексте:
[1] ЛАНИТ-Интеграция: http://itlanit.ru/
[2] Источник: https://www.op5.com/op5-monitor-v1/data-center-monitoring/
[3] Источник: http://fortune.com/2016/04/13/walmart-amazon-channel-advisor/
[4] Источник: https://www.flickr.com/photos/stars6/4381851322
[5] Источник: https://youth.md/tag/baze-de-date/
[6] Источник: https://www.youtube.com/watch?v=fbCmkFVCs5I
[7] MODBUS: https://ru.wikipedia.org/wiki/Modbus
[8] Источник: https://habr.com/post/428467/?utm_campaign=428467
Нажмите здесь для печати.