Рубрика «инфраструктура»

Как нашего заказчика не хотел отпускать провайдер - 1

История довольно короткая, но смешная. С ней реально столкнулся наш заказчик. Началось всё в тот момент, когда один из провайдеров ИТ-инфраструктуры решил перевезти свой дата-центр. И предупредил примерно за полгода всех своих клиентов о трёхдневном даунтайме, но так тянул время и организовывал бюрократическую волокиту, что некоторые заказчики к миграции попросту не успели подготовиться.

Представьте: вы CIO. Бюджета на аварийную дублирующую площадку у вас нет. Старого оборудования тоже нет. Бизнес связан с предоставлением медицинских услуг, здесь каждый лишний час промедления стоит дорого: один день простоя грозит финансовыми и имиджевыми потерями, равными годовой прибыли, два часа — начнут страдать клиенты.

А теперь добивающий аккорд: переезд вам по факту осложняют, ставя в рамки и согласовывая каждый чих по месяцу. Потому что вы же много платите провайдеру, зачем вас отпускать?
Читать полностью »

Наш многолетний эксперимент – внедрение Dell EMC ScaleIO в Облаке КРОК - 1

Над большой тестовой инсталляцией, на которой крутился сторадж на базе ScaleIO от Dell EMC, мы издевались всяческим образом пару лет точно, а то и больше. Внесли огромное количество исправлений и допилили наконец-то продукт под нашу облачную инфраструктуру. Сторадж заполняет у нас крайне востребованную нишу между обычным медленным хранилищем на базе HDD и скоростным решением на all-flash массивах. Более того, в силу своей Software Defined специфики он позволяет собирать отказоустойчивые стораджи чуть ли не из палок с ветками. Только учтите, что совсем экономить на железе смысла нет, стоимость лицензии перевесит выгоды от экономии.

Короче говоря, сегодня я расскажу вам, как мы внедряли ScaleIO и ходили по граблям с закрытыми глазами. Про архитектурные особенности стораджа и его интеграцию в Облако. И, конечно, будет про нагрузочное тестирование. За подробностями — добро пожаловать под кат.
Читать полностью »

Громкий звук системы пожаротушения вывел из строя диски в дата-центре Nasdaq - 1

В шведском дата-центре Digiplex, который используется Nasdaq для осуществления операций в Северной Европе, в середине апреля произошел серьезный сбой. Вышли из строя жесткие диски многих серверов. Причиной стала неверно настроенная система пожаротушения — она издавала при работе крайне громкий звук, который привел к повреждениям дисков.Читать полностью »

Кому НЕ надо переезжать в облако и почему - 1

В прошлый раз я говорил о мифах при переносе ИТ-инфраструктуры в облако. И последний из них был о том, что далеко не всегда в облако вообще надо что-то переносить. На нём хочу остановиться подробнее, потому что здесь часто путают историю с «нам сложно организационно» и «нам это не нужно по техническим причинам».

Первая причина — кто-то уже успел купить железо. Очень часто бывает так, что в организацию приходит новый ИТ-директор и видит следующую картину: полгода назад его предшественник уже купил оборудование, оно ещё на поддержке и гарантии и будет работать года три стабильно. Естественно, в этой ситуации надо строить всё на нём просто по экономическим причинам.

Более сложная ситуация — это когда железо кто-то купил 20 лет назад (я сейчас не шучу), а оно ещё нужно. Точнее, нужно что-то, совместимое с ним. Я видел софт, который писался 15 лет назад, 20 лет назад и даже 25 лет назад. Тот, кто его писал, давно уже умер или не работает. А это, например, реестр в госструктуре на мейнфрейме или код банка, привязанный к микроинструкциям конкретной линейки процессоров или специфическим функциям ОС. Исходников нет. Документация только для эксплуатации. Если повезёт.

Так вот, если кто-то говорит, что это можно взять, отреверсить и переписать на современном языке, — плюньте ему в лицо, наступите на спину и попрыгайте.
Читать полностью »

Что мы читали в марте: пять необходимых книг для инженеров инфраструктуры - 1

Мы в Skyeng понемногу строим свою библиотеку важных и полезных книг. Началось все с того, что своими списками в Фейсбуке поделились основатели компании (ссылки ниже), а теперь к ним присоединились и руководители направлений. В марте свой топ профессиональной литературы представила Надежда Рябцова, отвечающая за нашу IT инфраструктуру. Я попросил ее рассказать о каждой книге чуть подробнее – надеюсь, читателям Хабры этот список, дополненный четырьмя еженедельными рассылками, будет полезен.
Читать полностью »

Как мы побеждали бардак с железом и становились бюрократами с нуля - 1
Разница между документацией и базой знаний: документация говорит, что это устройство охлаждает воздух до +18 градусов по Цельсию, а база знаний подсказывает, что есть редкий баг, когда два датчика сразу показывают -51 тысячу градусов и устройство начинает лихорадочно греть воздух для серверов.

Когда ты начинаешь новый маленький проект, то у тебя железка лежит на полу, нет документации, нифига вообще нет и можно работать работу. Потом проект вырастает до размеров нескольких сотен человек и тысяч железок, и тебе надо знать, где что точно лежит, как что делать и так далее.

Нужен нормальный учёт всего. Нужна документация. Не нужны ситуации, когда ты не знаешь, сколько и чего у тебя точно на складе. Не нужна история, что когда инженер заболел, остальные звонят ему домой и спрашивают, как он конфигурировал сервер год назад. Не нужна история, когда кто-то сказал поднять 10 серверов и два разных человека сделали это по-разному.

Но начали мы с простого. Вопросы были такими: Кто обновляет прошивку сервера? Кто отвечает за результат? Как это делается? Кого надо предупредить? Как писать план отката и что делать, если сервер упадёт? Кто-то записал все телефоны нужные заранее хотя бы?

В общем, первые же грабли вас или убьют к чертям, или научат делать всё правильно. У нас случилось второе и без граблей. Почти без граблей. Если у вас уже есть хаос, то наш опыт может оказаться полезным, потому что сейчас нам стало лучше.
Читать полностью »

Мы нашли крупную компанию, которая 5 лет не занималась информационной безопасностью, и она ещё жива - 1

Примерно 5-6 лет назад там был реально крутой админ, который настроил сеть как часы и оснастил современным на тот момент оборудованием экономсегмента. Недостаток бюджета админ компенсировал хорошими конфигами и правильной архитектурой. В общем, видно, что было сделано много работы.

Потом компания разделилась на две, расширилась, в ней всё поменялось пару раз — и за всё это время сеть поддерживали на костылях. Поскольку ИТ не профильный бизнес нашего заказчика, ситуация в целом понятна. Она такая много где, но чтобы большая сеть (территориально распределённая компания, десятки филиалов) продержалась в таком виде 5 лет — я такого ещё не видел.

Собственно, и не продержалась. Нас позвали провести аудит сетевой инфраструктуры после зафиксированного случая взлома, когда их базы данных со всей представляющей коммерческую тайну информацией оказались просто скачаны. Точнее, всплыли не у тех людей.
Читать полностью »

Перевод отчёта «Magic Quadrant for Application Performance Monitoring Suites» авторов-аналитиков Will Cappelli, Sanjit Ganguli, Federico De Silva.

В своих материалах Gartner обещал выпустить отчет по системам мониторинга (он же Magic Quadrant for APM Suites) 30 декабря 2017 года, но, видимо, аналитики были заняты более важными делами и просрочили аж почти на 3 месяца. Я не привередничаю — выпустили, и на том спасибо. Этот отчет можно воспринимать как итоги 2017 года, потому что никаких новостей из 2018 в нем нет. Появились некоторые новые участники, ушли некоторые старые. Очень любопытно читать события ушедшего года, за которыми иногда удавалось следить в режиме реального времени. Заглядывайте под кат — там интересно.

Когда каждому производителю был задан вопрос о том, кем были его основные конкуренты, AppDynamics и Dynatrace были названы чаще остальных, за ними следуют New Relic, Splunk, а затем CA Technologies. Когда респондентов опроса просили определить других поставщиков APM, которых они рассмотрели, прежде чем сделать свой окончательный выбор, последовательность немного изменилась: AppDynamics, CA Technologies, Dynatrace и New Relic. Отметим, что Splunk не отвечает современным техническим требованиям для включения в это исследование.

Читать полностью »

ИТ-прогнозы 2018 года: 8 инфраструктурных трендов - 1

Конец года — время подведения итогов и обсуждения грядущих трендов. Мы проанализировали соответствующие материалы аналитиков Gartner, IDG и других компаний, чтобы понять, как на самом деле будет развиваться направление ИТ-инфраструктуры.Читать полностью »

Администрация OpenStack Project опубликовала исследование собственной аудитории. Помимо прочего, документ интересен тем, что позволяет изучить текущие тренды на рынке Iaas, и, например, понять, какие ОС наиболее популярны в этой сфере.

Серверная версия Ubuntu уже несколько лет кряду возглавляет список самых популярных, однако по сравнению с 2016 годом ее популярность упала на 22% — если год назад ее применяли 74% пользователей OpenStack, то в 2017 году таких оказалось только лишь 52%.

Статистика популярности операционных систем в IaaS: Ubuntu пока номер один, популярность CentOS растет - 1

Если анализировать распределение популярности ОС только среди крупных проектов (1000 ядер и более), то здесь Ubuntu также идет на первом месте, а CentOS за год набрала серьезную популярность. Если тогда второе место по популярности в крупных инфраструктурах занимал Red Hat Enterprise Linux (21%), а у CentOS было лишь 13%, то в новом году ситуация кардинально изменилась — теперь RHEL пользуются лишь 10% проектов, а CentOS выросла до 31%:
Читать полностью »