…Был обычный ноябрьский вечер, 2024 год шёл к своему завершению: на носу была «чёрная пятница». Я вернулся домой в Новосибирск из почти двухнедельной командировки, пробыв в пути 12 часов и поспав часа четыре. В 19:07 алерт сообщил мне о падении одного из контроллеров. В целом, проблема не критичная, так как сервисы зарезервированы. Но всё же одним глазом я заглянул в чат с разбором.
Рубрика «отказоустойчивые системы»
Ночь с пятницы на понедельник: борьба за устойчивость, когда облако дало сбой
2026-02-05 в 6:00, admin, рубрики: sla, инцидент-менеджмент, инциденты, надежность, отказоустойчивость, отказоустойчивость сетей, отказоустойчивые системыПовышение качества выпускаемого ПО путем работы с инцидентами
2025-03-21 в 7:27, admin, рубрики: инцидент-менеджмент, инциденты, отказоустойчивые системы, стабильность системыВсем привет! Меня зовут Даша Мельникова, я ведущий релиз-менеджер в МКБ.
У нас в IT более 2500 сотрудников в 120+ команд, и этими силами мы раз в две недели выпускаем более 500 релизов. В рамках этой статьи мы будем говорить об инцидентах, и их количество относительно общего числа задач будет небольшим, но мы будем улучшать сами процессы.
Особенности построения Wi-Fi сети на инновационном пищевом производстве
2018-10-23 в 17:31, admin, рубрики: wi-fi, автоматизация процессов, бесперебойное питание, Блог компании Открытые Технологии, единая информационная среда, индустрия 4.0, инженерные системы, отказоустойчивые системы, промышленные объекты, ЧеркизовоВводная часть
Современный уровень развития технологии производства, автоматизации процессов, информационных сервисов управления и учета с одной стороны, высокий уровень внутренней и внешней конкуренции, ужесточение требований к качеству продукции, оптимизация затрат, борьба за конечного потребителя с другой, ставит перед производителями широкий круг вопросов по комплексной модернизации производства. При такой модернизации меняется не только технология, сервисы, технические аспекты, информационная среда, но и психология всего процесса (производства). Таким образом производитель старается оптимизировать весь процесс, исключая на разных этапах вероятные «точки отказов». Как известно большой процент отказов обусловлен «человеческим» фактором, чем больше людей в цепочке операций, тем выше вероятность ошибок, порчи технологического оборудования и как результат брак, простой производства, срыв сроков поставок, штрафы и так далее.
Читать полностью »
Наш рецепт отказоустойчивого Linux-роутера
2017-06-19 в 5:17, admin, рубрики: dhcpd, keepalived, linux, NetGWM, powerdns, Ubuntu, Блог компании Флант, Настройка Linux, отказоустойчивые системы, роутеры, Сетевые технологии, системное администрирование
В высоконагруженных проектах всегда повышенные требования к избыточности и надежности. Одним из важнейших звеньев инфраструктуры является маршрутизатор, потому что от его устойчивости зависит доступность сети в целом. Именно на таких узлах мы используем одну из схем реализации отказоустойчивого виртуального роутера на базе GNU/Linux с использованием iproute2, NetGWM, keepalived, ISC DHCPD, PowerDNS. Как мы всё это настраиваем, читайте в этой статье.Читать полностью »
Гипер-конвергентное решение – FusionCube и FusionSphere Openstack для провайдера облачной услуги
2016-07-11 в 15:40, admin, рубрики: FusionSphere, huawei, openstack, ruvds, software defined storage, Блог компании RUVDS.com, виртуализация, облачные технологии, отказоустойчивые системы, СХД, хостинг, хостинг-провайдер
Продолжаем публиковать материалы форума Облачные технологии в России, который наша компания вместе с технологическим партнером HUAWEI провели 23 июня в LOTTE HOTEL MOSCOW. Первые три части вы можете прочитать здесь: часть I, часть II, часть III. Сегодня представляем читателям интересный доклад Дениса Дубинина на тему современных инструментов создания облачных решений.
Читать полностью »
