- PVSM.RU - https://www.pvsm.ru -
Сегодня мы поговорим, как ХостТрекер решает следующие задачи:

После того как пользователь добавляет сайт для мониторинга, система начинает его опрашивать с заданным интервалом. Интервал может быть в диапазоне от минуты до часа.
Проверки осуществляются с географически распределенных точек мониторинга [1]. Это все независимые сервера, разнесенные по миру. Сейчас их более 20-ти.
Агент выбирается случайным образом из общего пула текущих рабочих агентов. Если при проверке точка вернула ошибку, то запускается процесс перепроверки с 5-7 независимых агентов. После перепроверки сайт считается «упавшим», если большинство точек подтверждают проблему. Иначе считается, что возникла локальная проблема на агенте, который зафиксировал «начальную ошибку».

Такой же алгоритм с определением «поднятия».
Алгоритм позволяет свести ложные срабатывания практически к нулю.
Мы судим о недоступности сайта, только на основе проверок с заданным интервалом. Сказать со 100% вероятностью, что сайт делал между проверками, нельзя. Однако с большой вероятностью между двумя проблемными проверками — сайт лежит. А вот если после ошибки идет восстановление, то в этот интервал сайт может как лежать, так и работать. На основе этого мы рассчитываем пессимистичный и оптимистичный аптайм. О чем идет речь можно понять взглянув на рисунок.
Оптимистичный аптайм учитывается при расчете статистики. А при нотификации пользователей, в алертах даунтайм указывается по пессимистичному сценарию.
Да пребудет с Вами Uptime!
Автор: smiHT
Источник [2]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/hosting/51024
Ссылки в тексте:
[1] географически распределенных точек мониторинга: http://www.host-tracker.com/Agent/List
[2] Источник: http://habrahabr.ru/post/206428/
Нажмите здесь для печати.