Рубрика «отказоустойчивость»

Бас-фактор глазами водителя автобуса

2025-12-01 в 7:15, admin, рубрики: bus factor, отказоустойчивость

Телефонный звонок. Трубку берет отец трех дочерей и слышит:
— Это ты, мой лягушонок?
— Нет. Это хозяин пруда.

В последнее время стало привычно ссылаться на бас-фактор, как на что-то, что обязательно похоронит ваш проект, если вы наймете хоть одного толкового специалиста. Бизнесу, якобы, нужны сплошь взаимозаменяемые винтики, с правильно вывернутым гетеродином лайф-ворк баланса, способные хорошо использовать данные свыше фреймворки и библиотеки.

Читать полностью »

Что мы изменили в сети, чтобы сделать её устойчивее

2025-07-31 в 9:00, admin, рубрики: fail-safe, headless, Infrastructure, высокая производительность, инфраструктура, отказоустойчивость, сеть

Даже сложная и продуманная технологическая система не застрахована от инцидентов — это касается любых инфраструктур, от железнодорожных и коммунальных до IT. Поэтому инженерам, которые обеспечивают надёжность систем, важно не только предотвращать проблемы, но и минимизировать их влияние за счёт хорошего антикризисного (или DR) плана.

Читать полностью »

10 Принципов отказоустойчивости (с примерами на Javascript)

2025-06-15 в 18:16, admin, рубрики: error handling, fallback, UX, архитектура, надежность, отказоустойчивость, ошибки, стабильность, устойчивость

Отказоустойчивость (англ. resilience, fault tolerance) — это способность системы продолжать работу, несмотря на внутренние ошибки, сбои в зависимостях или непредвиденные ситуации.

Читать полностью »

Как мы почту закаляли: поэтапный харденинг инфраструктурных сервисов на практике

2024-12-17 в 13:19, admin, рубрики: архитектура, безопасная инфраструктура, инфраструктурные системы, ит-ландшафт, отказоустойчивость, построение инфраструктуры, почтовый сервер, хакерские атаки, электронная почта

Читать полностью »

Как Elasticsearch поломал сборки и «обнулил» звёзды в Github

2024-10-30 в 20:50, admin, рубрики: elastic, elasticsearch, отказоустойчивость

Казалось бы, майская история с Docker hub должна была научить всех нас уделять больше времени на обеспечение целостности артефактов проекта, но на то мы и люди, чтобы учиться на своих (и чужих) ошибках не с первого раза. В этой статье я поведаю про настоящую историю, которая в этот раз не связана с образами, но связана с библиотеками.

Обыкновенный вторник второй половины октября, через час запланирован релиз в продакшн, ничего не предвещало, а ожидаемые заказчиком фичи уже протестированы вдоль и поперёк, ожидая своего часа.

Читать полностью »

Понимание кругового DNS

2024-10-29 в 12:15, admin, рубрики: Round Robin DNS, балансировка трафика, облачные сервисы, отказоустойчивость, распределение нагрузки, тестирование сайтов

Для OpenFreeMap я использую серверы за Round Robin DNS. В этой статье я пытаюсь понять, как браузеры и CDN выбирают, какой из них использовать.

Что такое циклический DNS?

Обычно, когда вы обслуживаете веб-сайт с помощью VPS, например Digital Ocean или Hetzner, вы добавляете одну запись A в панель управления вашего DNS-провайдера.

Это означает, что rr-direct.hyperknot.com будет обслуживать данные с 5.223.46.55.

Читать полностью »

Как организовать анализ большого объема данных в реальном времени

2024-08-01 в 11:13, admin, рубрики: olap, oltp, tarantool, tarantool column store, архитектура, отказоустойчивость

С ростом сложности ИТ-систем и задач аналитики изменяются требования и к возможностям инструментов. Для многих сценариев приоритетными становятся решения, которые могут работать как с историческими данными, так и с теми, которые обновляются в реальном времени. То есть аналитикам все чаще нужен инструмент, работающий на стыке возможностей транзакционных и аналитических (OLAP и OLTP) систем.

Читать полностью »

Go Tarantool: как построить Key-value-хранилище на сотни тысяч запросов в секунду

2024-07-19 в 10:24, admin, рубрики: tarantool, архитектура, отказоустойчивость

С увеличением сложности ИТ-систем все больше становится очевидной ограниченность привычных реализаций с простой архитектурой компонентов. Особенно это заметно в случае систем, которые должны стабильно работать с большими и интенсивными нагрузками.

Читать полностью »

А в чем проблема работать с файлами?

2024-03-28 в 8:00, admin, рубрики: .net, восстановление, данные приложения, отказоустойчивое хранилище, отказоустойчивость, сбой, файловая система, файлы, хранение данных, целостность

Приветствую.

Год назад меня сильно увлекла тема отказоустойчивости приложений. Я начал изучать различные аспекты ее реализации в программах и больше всего меня заинтересовал процесс работы с диском. Ресурсов для изучения много, но они все разбросаны по сети и мне понадобилось время, чтобы сложить все кусочки пазла. Здесь я попытаюсь этот пазл собрать воедино, чтобы структуризировать полученные знания.

Для начала разберем путь операции записи, начиная с самого приложения.

Приложение

Все начинается в нашем коде. Обычно имеется интерфейс для работы с файлами. Это зависит от ЯП, но примеры:

fwrite - C

Читать полностью »

Отказоустойчивая архитектура: почему Tarantool не падает?

2023-10-24 в 9:01, admin, рубрики: tarantool, архитектура, отказоустойчивость

Основная проблема в высоконагруженных приложениях — отказоустойчивость. Нагрузка с упавших узлов в кластере должна переключаться на живые. Это кажется несложной задачей, но на практике появляется много подводных камней. Мы с yngvar_antonsson потратили много времени на поддержку различных кластеров, построенных на Tarantool и наших кластерных фреймворках Cartridge и TDG, и сегодня расскажем вам, как обеспечивается отказоустойчивость в наших приложениях. Будет интересно всем, кто хочет подробнее узнать, как устроен фейловер в Cartridge, и тем, кто хочет узнать о нашем опыте создания автоматических фейловеров.
Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «отказоустойчивость»

Бас-фактор глазами водителя автобуса

Что мы изменили в сети, чтобы сделать её устойчивее

10 Принципов отказоустойчивости (с примерами на Javascript)

Как мы почту закаляли: поэтапный харденинг инфраструктурных сервисов на практике

Как Elasticsearch поломал сборки и «обнулил» звёзды в Github

Понимание кругового DNS

Как организовать анализ большого объема данных в реальном времени

Go Tarantool: как построить Key-value-хранилище на сотни тысяч запросов в секунду

А в чем проблема работать с файлами?

Приложение

Отказоустойчивая архитектура: почему Tarantool не падает?