Рубрика «эксплуатация»

Дисклеймеры

  • Кому-то данная статья покажется стёбом. Если вдруг вы обнаружили себя в этой категории, попробуйте вспомнить старый афоризм "В каждой шутке есть доля шутки". Может быть, это поможет вычленить ту самую долю.

  • Было бы интересно подискутировать с кем-то по сути, а от споров по частностям (в том числе описанным в статье) буду дистанцироваться.

В общем, я предупредил, а уж вам решать, что с этим делать. Приступим...

Поветрия

Я наблюдаю за развитием IT в течение приблизительно четверти века, и с каждым днём меня всё сильнее удручает происходящее.

Читать полностью »

Этому не научат на онлайн-курсах: к чему готовиться дежурному инженеру по эксплуатации - 1

Привет! Меня зовут Илья, я отвечаю за направление охраны труда в Selectel. Среди прочего организовываю обучения для инженеров дата-центров, чтобы они получали необходимые знания и квалификации.

Недавно мой коллега Валентин рассказал, как инженеры ИТО обучают молодых специалистов азам работы. Я же опишу подготовку с другой стороны: как мы готовим дежурных инженеров к выходу в смену. Дежурные инженеры — это специалисты, которые наблюдают за безопасной эксплуатацией оборудования дата-центров, следят за показателями систем и реагируют на них.

В статье расскажу, как выстроена система обучения, что в нее входит и как нам удалось сократить время реагирования на нештатные ситуации в три раза. Всем, кто хочет увидеть нашего манекена для тренировки СЛР, воскрешенного уже сотни раз, — добро пожаловать под кат.
Читать полностью »

Мне кажется, что российские VPS-VDS-хостинги родом из ада (и да, мы косячим тоже) - 1
В общем, сразу хочу сказать, что мнение про ад и то, что сервис у многих из двухтысячных — это оценочное суждение. На самом деле, конечно, они родом из России. На самом деле, конечно, мы тоже хороши, и об этих пятнах в биографии я тоже расскажу. На самом деле, в последние годы та же поддержка у многих стала гораздо лучше. Но всё равно кое у кого родословная кое-где да всплывает.

Давайте я пройдусь по проблемам, которые часто прямо нереально болят у клиентов хостинга, расскажу, что хорошо-плохо у нас и как это выглядит в других хостингах в России и за её пределами (но там, очевидно, я знаю про внутрянку меньше).

Первая история — железо. Клиентов нереально бесит, когда полетел RAID-контроллер или вылетело сразу несколько дисков, и поддержка делает простой на замену. У нас был один клиент, которого сначала рикошетом зацепило DDoS по соседней VDS в том же серваке, потом через два часа начались плановые работы с сетевым адаптером, а потом ещё и рейд ушел в ребилд после включения-перезагрузки. К вопросу дидосов мы ещё вернёмся, кстати.

Так вот, можно взять дешёвое «околобытовое» железо и часто его чинить, а можно серверное — у нас Хуавей корпоративной линейки. Насколько я знаю, профессиональное серверное железо есть у нас и ещё у двух игроков на российском рынке. Поправьте меня, если ошибаюсь. Это потому что мы на старте считали, что проживём больше пяти лет и решили списывать старое железо минимум через пять лет после начала эксплуатации. Кстати, опять же, примерно так и появился тариф за 30 рублей за VDS, смекаете?Читать полностью »

Инженерный спецназ: жара и холод - 1
Используем товары ближайшего магазина для приготовления технической промывочной смеси.

Банк, аудит системы хладоснабжения ЦОДа. Есть действующая служба эксплуатации банка, у них сервисный договор с организацией ООО «Весёлые медузы». Ребята работают, деньги получают. Но системы сбоят регулярно, останавливаясь по высокому давлению, когда температура на улице повышается.

Приезжаем на место на Дальний Восток разбираться. Собрали фреон, взвесили, сравнили проектный расчёт от производителя и фактическую заправку. Всё просто: предыдущий «сервис» налил в него больше, чем нужно.

Есть шильдик, где написаны модель, серийный номер и большими буквами, сколько нужно заправлять хладагента. Но всё это игнорируется, люди работают по ощущениям:

— Зачем весы? Я же и так знаю, сколько туда надо. Был баллон 15 килограммов — стал весить примерно 12. Ну я и заправил три килограмма. Почему три? Ну этого же достаточно.

Или вот, например, крупный завод на Урале, там другая проблема. На монтаже подрядчик забыл добавить в хладоноситель присадку, которая снижает агрессивность среды. Через два года металлическую трубу разъело изнутри коррозией. Дальше — аварийная остановка оборудования. Мы приехали, перебрали. Почему изначально после запуска системы в работу никто не сделал отбор пробы хладоносителя, не провёл анализ химического состава для безопасной эксплуатации — вопрос. Читать полностью »

Мониторинг в ЦОДе: как мы меняли старую BMS на новую. Часть 1 - 1

Что такое BMS

Система мониторинга работы инженерных систем в ЦОДе – ключевой элемент инфраструктуры, напрямую влияющий на такой важный показатель для дата-центра, как скорость реакции персонала на аварийные ситуации и, следовательно, на продолжительность бесперебойной работы. 

Системы мониторинга BMS (Building Monitoring System) предлагают многие глобальные вендоры оборудования для ЦОДов. За время работы Linxdatacenter в России нам довелось познакомиться с разными системами и столкнуться с диаметрально противоположными подходами вендоров к эксплуатации этих систем. 

Рассказываем, как мы полностью обновили нашу систему BMS за последний год и почему.  
Читать полностью »

29 ноября в Mail.ru Group пройдет @Kubernetes Conference - 1

Привет, друзья. Приглашаем на @Kubernetes Conference 29 ноября в Mail.ru Group всех, кто вместе с нами строит экосистему Kubernetes в России — использует, внедряет K8s в Production, создает свои инструменты для работы с ним, ищет пути решения проблем, помогает другим перейти на Kubernetes и работает над распространением знания о нюансах использования технологии.

В программе вас ждут:

  • Безопасные сети Kubernetes c eBPF и Cilium. Как глубоко работать с сетью на уровне ядра;
  • Интерактив «Helm глазами разработчиков. RollingUpdate Puzzle»;
  • Внедрение OpenShift в «Росгосстрахе»: от DevOps до Production-эксплуатации;
  • Управление кластером K8s через Cluster API. Как Tinkoff.ru писали свой Infrastructure Provider BareMetal;
  • Проект «Платформа». Как мы переводим на Kubernetes сервисы Mail.ru Group;
  • Как мы катили K8s в Production eldorado.ru. Наш год американских горок;
  • Также вас ждет воркшоп для тех, кто еще только на пути к Kubernetes — «Как запустить ваше приложение в Kubernetes. Деплой, мониторинг, логирование».

Конференция пройдет 29 ноября (пятница) в 14:00 в московском офисе Mail.ru Group (Ленинградский проспект, д. 39, стр. 79). Регистрация обязательна и закрывается 25 ноября в 11:59 утра (или раньше, если закончатся места).
Читать полностью »

@DevOps Meetup #2 в Mail.ru Group: 22 августа - 1

Привет, друзья. Без громких слов, приглашаем всех Dev, Ops и сочувствующих на @DevOps Meetup #2 — послушать:

  • как Райффайзенбанк перешел от зоопарка инструментов CI/CD к централизованному конвейеру на базе стека Atlassian;
  • о сложностях логирования и мониторинга от «Рунет Бизнес Систем» — вы узнаете, как сделать полезную и безопасную агрегацию в условиях динамической инфраструктуры;
  • и напоследок выступит Росгосстрах с рассказом о лучших практиках своего DevOps’а.

Встреча пройдет 22 августа (четверг) в 18:30 в московском офисе Mail.ru Group (Ленинградский проспект, д. 39, стр. 79). Регистрация обязательна и закрывается 20 августа в 23:59 (или раньше, если закончатся места).
Читать полностью »

В Германии стоимость поездки на электромобиле может быть выше, чем на дизельном авто - 1

В Германии постепенно растет недовольство в сообществе любителей электромобилей, связанное с сильным ростом цен на электроэнергию на зарядных станциях. В зависимости от поставщика услуг и условий контракта цена на быстрых зарядных станциях постоянного тока, особенно актуальных для тех, кто много ездит, может колебаться от 39 до 89 центов за кВт*ч электроэнергии. Как следствие — при определенных условиях стоимость поездки на электромобиле получается выше, чем на дизельном. К сожалению, пока улучшений не предвидится.
Читать полностью »

Я хочу рассказать про то, как мы продолжаем убивать бумажный документооборот. Одна из областей, которая сдалась совсем недавно, — это технический документооборот, то есть все бумаги, которые нужны в процессе проектирования, строительства и других стадий жизненного цикла любого объекта. Давайте представим, что вам нужно построить башню. Это примерно то же самое, что строить Тёмную башню, но куда мрачнее по уровню бюрократии.

Документы на здание: маленькие радости автоматизации на примере Тёмной башни - 1

У такого строительства — даже если это Тёмная башня — есть чёткий (но довольно большой и сложный) процесс. Одни документы перетекают в другие, например, начинается всё с инженерных изысканий, потом появляется эскиз, потом сам проект, разрешения, вот уже сметы, служебные записки с замечаниями про то, что бак нашей башни не так отштукатурили и так далее. И в конце — регламенты и инструкции по эксплуатации.

Итак, башни еще нет, а документооборот уже есть, и он появляется задолго до строительства. Но уже с этапа возникновения идеи башни может использоваться наша система технического документооборота.Читать полностью »

Машинное обучение позволяет сделать сервис гораздо удобнее для пользователей. Начать внедрять рекомендации не так сложно, первые результаты можно получить, даже не имея налаженной инфраструктуры, главное начать. А уже потом строить масштабную систему. Именно так все начиналось в Booking.com. А во что это вылилось, какие сейчас используются подходы, как модели внедряются в продакшен, каких их мониторить, рассказал Виктор Билык на HighLoad++ Siberia. Возможные ошибки и проблемы не остались за бортом доклада, кому-то это поможет обойти мели, а кого-то натолкнет на новые идеи.

Machine learning @ booking.com - 1

О спикере: Виктор Билык внедряет продукты машинного обучения в промышленную эксплуатацию в Booking.com.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js