Рубрика «HA»

Оживляем дешевый Smart TV: обход вырезанного ADB, деблоат Яндекс.ТВ и сборка легкого медиацентра

2026-06-04 в 12:52, admin, рубрики: adroid tv, HA, hartens, home assistance, алиса, бытовая техника, телевизор, яндекс тв

Читать полностью »

Руководство по обеспечению высокой доступности в Kubernetes

2022-05-29 в 10:00, admin, рубрики: HA, kubernetes, ruvds_перевод, Блог компании RUVDS.com, высокая доступность, распределенные системы, Серверное администрирование

Перед вами полноценный гайд по запуску приложений с высокой доступностью (HA) в Kubernetes. В его основу лёг мой многолетний опыт работы с этой системой, приправленный лучшими практиками из официальной документации OpenShift и Kubernetes. Читать полностью »

Как реализуется отказоустойчивая веб-архитектура в платформе Mail.ru Cloud Solutions

2019-11-05 в 13:00, admin, рубрики: api, BGP, HA, haproxy, ITSumma, Mail.Ru Cloud Solutions, openstack, uptime, uptimeday, балансировщик, Блог компании Mail.Ru Group, виртуализация, высокая производительность, Облачные вычисления, отказоустойчивость, системное администрирование

Как реализуется отказоустойчивая веб-архитектура в платформе Mail.ru Cloud Solutions - 1

Привет! Я Артем Карамышев, руководитель команды системного администрирования Mail.Ru Cloud Solutions (MCS). За последний год у нас было много запусков новых продуктов. Мы хотели добиться, чтобы API-сервисы легко масштабировались, были отказоустойчивыми и готовыми к быстрому росту пользовательской нагрузки. Наша платформа реализована на OpenStack, и я хочу рассказать, какие проблемы отказоустойчивости компонентов нам пришлось закрыть, чтобы получить отказоустойчивую систему. Я думаю, это будет любопытно тем, кто тоже развивает продукты на OpenStack.

Общая отказоустойчивость платформы складывается из устойчивости её компонентов. Так что мы постепенно пройдём через все уровни, на которых мы обнаружили риски и закрыли их.

Видеоверсию этой истории, первоисточником которой стал доклад на конференции Uptime day 4, организованной ITSumma, можно посмотреть на YouTube-канале Uptime Community.
Читать полностью »

Высокодоступный и масштабируемый Elasticsearch в Kubernetes

2018-12-07 в 8:27, admin, рубрики: devops, elasticsearch, HA, kibana, kubernetes, Блог компании Southbridge, Серверное администрирование, системное программирование

В предыдущем посте мы масштабировали набор реплик MongoDB и познакомились со StatefulSet. Сейчас мы займемся оркестрацией кластера высокой доступности Elasticsearch (с другими мастер-нодами, нодами данных и клиентскими нодами) и задействуем ES-HQ и Kibana.

Вам понадобятся:

Базовое представление об Elasticsearch, его типах нод и их ролях.
Работающий кластер Kubernetes как минимум с тремя нодами (не меньше четырех ядер, 4 ГБ).
Умение работать с Kibana.Читать полностью »

Kubernetes-HA. Разворачиваем отказоустойчивый кластер Kubernetes c 5 мастерами

2018-05-10 в 14:11, admin, рубрики: devops, HA, k8s, kubernetes, кластер, системное администрирование

Здравствуйте!

В данной публикации я хотел бы рассказать о кластере Kubernetes с высокой доступностью (HA).

Оглавление:

Вступление
Список используемого софта
Список и назначение хостов
Принцип работы и развертывания
Подготовка ОС к развертыванию. Установка docker, kubeadm, kubelet и kubectl
Подготовка конфигурационного скрипта
Создание etcd кластера
Инициализация мастера с помощью kibeadm
Настройка CIDR
Инициализация остальных мастернод
Настройка keepalived и виртуального IP
Добавление рабочих нод в кластер
Дополнительно
- Dashboard
- Heapster

Читать полностью »

Обеспечение доступности данных и сервисов: показатели RPO, RTO и планирование SLA

2017-05-10 в 6:02, admin, рубрики: DR, HA, RTO, sla, аварийное восстановление, бекап, Блог компании «Veeam Software», Восстановление данных, высокая доступность, кластер, отказоустойчивость, резервное копирование, репликация, системное администрирование, цод

Сегодня я постараюсь разъяснить, что такое концепция доступности данных с точки зрения ИТ-специалиста, будь то ИТ-администратор, системный интегратор, консультант по внедрению и т.д. Надеюсь, что эта статья будет полезна читателям при составлении экономического обоснования на внедрение соответствующих программных иили аппаратных решений, а также соглашений об уровне обслуживания (SLA) – а кому-то поможет сделать эти документы более убедительными.
Для начала в качестве «узелков на память» сформулирую два постулата, с которыми многие, уверен, довольно хорошо знакомы:

RPO (recovery point objective) – допустимая потеря данных. Любая информационная система должна обеспечивать (внутренними ли средствами, или сторонними) защиту своих данных от потери выше приемлемого уровня.
RTO (recovery time objective) – допустимое время восстановления данных Любая информационная система должна обеспечивать (внутренними ли средствами, или сторонними) возможность восстановления своей работы в приемлемый срок.

Часто эта пара показателей отображается в виде одномерного графика вдоль оси времени.
Но в таком одномерном графике нет самого главного, на что ориентируется бизнес – денег! О том, как рассчитывать RTO и RPO, исходя из требований бизнеса, я расскажу под катом.

Обеспечение доступности данных и сервисов: показатели RPO, RTO и планирование SLA - 1

Читать полностью »

NetApp ONTAP & ESXi 6.х tuning

2016-11-09 в 6:42, admin, рубрики: alua, cDOT, disk misalignment, ESXi, esxi 4, esxi 5, ESXi 6, fc, FCoE, FCP, fibrechannel, gos, HA, HBA, high availability, iscsi, jumbo frames, linux, loadbalancing, misalignment, mpio, mtu, NAS, NetApp, NetApp FAS, nfs, nfs4, nfsv4, ONTAP, ontap 9, RDM, SAN, Solaris, tuning, vaai, vasa, vcenter, vmfs, VMware, VMWare ESXi, vsc, vSphere 6, vVOL, wafl, windows, высокая производительность

В продолжение темы об оптимизации ESXi хоста для взаимодействия с СХД NetApp ONTAP, эта статья будет просвещена оптимизации производительности VMWare ESXi 6.X, предыдущие статьи были посвящены тюнингу ОС Linux, Windows и VMware ESXi 5.X в среде SAN. Компания NetApp давно тесно сотрудничает с VMware, подтверждением тому может стать тот факт, что нашумевшая технология vVOL была реализована одной из первых ещё в релизе Clustered Data ONTAP 8.2.1 (Август 2014), в то время как vSphere 6.0 ещё даже не был выпущен. Компания NetApp первой объявила поддержку vVol c NFS (Возможно NetApp по-прежнему здесь единственный, не слежу). В связи с чем системы хранения ONTAP крайне популярны в этом окружении.
Эта статья будет полезна владельцам систем хранения с ONTAP, а часть про Disk Alignment будет полезна не только владельцам NetApp`а.

Настройки VMWare ESXi 6.X можно разделить на следующие части:

Оптимизация гипервизора
Оптимизация гостевой ОС (GOS)
Оптимальные настройки SAN (FC/FCoE и iSCSI)
Настройки NAS (NFS)
Проверка совместимости оборудования, прошивок и ПО

NetApp ONTAP & ESXi 6.х tuning - 1
Для поиска узкого места обычно выполняют методику последовательного исключения. Предлагаю перво-наперво начать с СХД. А дальше двигаться СХД -> Сеть (Ethernet / FC) -> Хост ( Windows / Linux / VMware ESXi ) -> Приложение.
Читать полностью »

КЛАСТЕР высокой доступности на postgresql 9.6 + repmgr + pgbouncer + haproxy + keepalived + контроль через telegram

2016-11-01 в 5:33, admin, рубрики: cluster, failover, HA, haproxy, keepalived, pgbouncer, postgresq, replication, repmgr, Администрирование баз данных, Блог компании Этажи, Серверное администрирование, хранение данных, метки: postgresq

На сегодняшний день процедура реализации «failover» в Postgresql является одной из самых простых и интуитивно понятных. Для ее реализации необходимо определиться со сценариями файловера — это залог успешной работы кластера, протестировать его работу. В двух словах — настраивается репликация, чаще всего асинхронная, и в случае отказа текущего мастера, другая нода(standby) становится текущем «мастером», другие ноды standby начинают следовать за новым мастером.
На сегодняшний день repmgr поддерживает сценарий автоматического Failover — autofailover, что позволяет поддерживать кластер в рабочем состоянии после выхода из строя ноды-мастера без мгновенного вмешательства сотрудника, что немаловажно, так как не происходит большого падения UPTIME. Для уведомлений используем telegram.

Появилась необходимость в связи с развитием внутренних сервисов реализовать систему хранения БД на Postgresql + репликация + балансировка + failover(отказоустойчивость). Как всегда в интернете вроде бы что то и есть, но всё оно устаревшее или на практике не реализуемое в том виде, в котором оно представлено. Было решено представить данное решение, чтобы в будущем у специалистов, решивших реализовать подобную схему было представление как это делается, и чтобы новичкам было легко это реализовать следуя данной инструкции. Постарались описать все как можно подробней, вникнуть во все нюансы и особенности.
Читать полностью »

SDS от NetApp: ONTAP Select

2016-06-30 в 9:59, admin, рубрики: CIFS, disaster recovery, DR, HA, high availability, IP SAN, iscsi, kvm, NAS, NetApp, NetApp SnapCreator, nfs, ONTAP, ONTAP Select, SAN, SDS, SnapCreator, snapmirror, SVM, Veeam, virtual storage appliance, VMware, VSA, vSphere, vVOL, ит-инфраструктура, системное администрирование, хранение данных, хранилища данных, метки: ONTAP Select

ONTAP Select это логическое развитие линейки Data ONTAP-v

Как и предшественник, этот продукт живёт и полностью опирается на традиционный RAID контроллер, установленный в вашем сервере. Также отсутствует поддержка FCP. Поддерживаются NAS (CIFS, NFS) и IP SAN (iSCSI) протоколы.

Из ожидаемых новшеств:

Поддержка High Avalability
Поддержка кластеризации до 4 нод
Максимальный полезный объем 400 ТБ (по 100ТБ на ноду в 4х нодовом кластере)

На ряду с High Avalability и кластеризацией по-прежнему поддерживаются однонодовые конфигурации.
SDS от NetApp: ONTAP Select - 1
Читать полностью »

К вопросу реализации персистентных процессов в управляющих системах реального времени (часть 2)

2016-06-14 в 19:12, admin, рубрики: HA, high availability, высокая готовность, ит-инфраструктура, надежность, Серверное администрирование, системное администрирование, системы управления, эксплуатация

Продолжение статьи.

Начало: часть 1

3. Аппаратура и встроенные программы

Данный уровень реализации системы управления характеризуется очень большой свободой выбора для разработчика. Поскольку мы выше договорились не рассматривать в данной статье специализированные аппаратные решения, ограничимся серийной аппаратурой общего назначения.
Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «HA»

Оживляем дешевый Smart TV: обход вырезанного ADB, деблоат Яндекс.ТВ и сборка легкого медиацентра

Руководство по обеспечению высокой доступности в Kubernetes

Как реализуется отказоустойчивая веб-архитектура в платформе Mail.ru Cloud Solutions

Высокодоступный и масштабируемый Elasticsearch в Kubernetes

Вам понадобятся:

Kubernetes-HA. Разворачиваем отказоустойчивый кластер Kubernetes c 5 мастерами

Обеспечение доступности данных и сервисов: показатели RPO, RTO и планирование SLA

NetApp ONTAP & ESXi 6.х tuning

КЛАСТЕР высокой доступности на postgresql 9.6 + repmgr + pgbouncer + haproxy + keepalived + контроль через telegram

SDS от NetApp: ONTAP Select

К вопросу реализации персистентных процессов в управляющих системах реального времени (часть 2)