Рубрика «graphite»

Сбор статистики MTProto Proxy

2018-07-03 в 15:50, admin, рубрики: DataDog, devops, docker, Go, golang, Grafana, graphite, mtproto, MTProto Proxy, proxy, telegram, zabbix, визуализация данных, Программирование, Системы обмена сообщениями

Содержание

Предыстория
Сбор статистики
Отображение статистики
Визуализация и ведение статистики
Развертка
Заключение

Предыстория

Привет хабр, телеграм сейчас на пике популярности, все скандалы, интриги, блокировки вертятся вокруг него, в связи с чем телеграм выкатил свой вариант прокси под названием MTProto Proxy который призван помочь с обходом блокировки. Однако предоставленные телеграмом сервисы для мониторинга MTProto Proxy не дают возможности наблюдать статистику в реальном времени и собирать её для наблюдения за её изменениями, потому мы будем решать проблему своими силами.
Читать полностью »

Хранение метрик: как мы перешли с Graphite+Whisper на Graphite+ClickHouse

2017-12-05 в 10:42, admin, рубрики: clickhouse, devops, graphite, monitoring, Блог компании Avito, системное администрирование, хранилища данных

Всем привет! В своей прошлой статье я писал об организации модульной системы мониторинга для микросервисной архитектуры. Ничего не стоит на месте, наш проект постоянно растёт, и количество хранимых метрик — тоже. Как мы организовали этот переход в условиях высоких нагрузок, об ожиданиях от него и результатах миграции читайте под катом.

Хранение метрик: как мы перешли с Graphite+Whisper на Graphite+ClickHouse - 1

Читать полностью »

Как обложить сервис метриками и не облажаться

2017-10-31 в 7:44, admin, рубрики: devops, Grafana, graphite, Блог компании СКБ Контур, визуализация данных, метрики, Промышленное программирование, скб контур

Меня зовут Евгений Жиров, я разработчик в инфраструктурной команде Контур.Экстерна. Этот пост — текстовая версия моего доклада с недавнего митапа Perm Tech Talks.

У нас в команде 200 микросервисов, которые должны быть отказоустойчивыми, чтобы пользователи не замечали никаких проблем. А проблемы, конечно, возникают. Поэтому мы собираем метрики, чтобы знать, как дела у конкретных сервисов и у системы в целом. Метрики помогают вовремя среагировать и всё починить.

Метрики можно собирать, хранить и визуализировать. И есть много способов собрать метрики неправильно, нарисовать с ошибками и сделать неверные выводы.

Я расскажу о нескольких примерах из своей работы и поделюсь советами.

Какие бывают метрики?

Как обложить сервис метриками и не облажаться - 1

Метрика requests.count.byhost.*

Читать полностью »

Мониторинг как сервис: модульная система для микросервисной архитектуры

2017-08-11 в 12:50, admin, рубрики: brubeck, carbon-c-relay, clickhouse, collectd, devops, Grafana, graphite, heapster, moira, Блог компании Avito, микросервисы, системное администрирование, хранилища данных

Сегодня на нашем проекте, помимо монолитного кода, функционируют десятки микросервисов. Каждый из них требует того, чтобы его мониторили. Делать это в таких объемах силами DevOps проблематично. Мы разработали систему мониторинга, которая работает как сервис для разработчиков. Они могут самостоятельно писать метрики в систему мониторинга, пользоваться ими, строить на их основании дашборды, прикручивать к ним алерты, которые будут срабатывать при достижении пороговых значений. С DevOps — только инфраструктура и документация.
Этот пост — расшифровка моего выступления с нашей секции на РИТ++. Многие просили нас сделать текстовые версии докладов оттуда. Если вы были на конференции или смотрели видео, то не найдете ничего нового. А всем остальным — добро пожаловать под кат. Расскажу, как мы пришли к такой системе, как она работает и как мы планируем её обновлять.
Мониторинг как сервис: модульная система для микросервисной архитектуры - 1
Читать полностью »

Обзор архитектуры и подсистем деплоя и мониторинга. Как инженеры делают систему прозрачной для разработки

2017-02-01 в 14:02, admin, рубрики: devops, graphite, puppet, rootconf, Блог компании Конференции Олега Бунина (Онтико), деплоймент, константин никифоров, Серверное администрирование, системное администрирование, метки: константин никифоров

Обзор архитектуры и подсистем деплоя и мониторинга. Как инженеры делают систему прозрачной для разработки - 1

Константин Никифоров ( melazyk )

Доклад будет про всякие секретные и не очень штуки, которые такая большая компания, как Mail.Ru, использует в мониторинге и для деплоя, и для управления конфигурацией.

Меня зовут Константин Никифоров, я являюсь руководителем группы системных администраторов в компании Mail.Ru. Наша группа занимается обслуживанием проектов target.my.com, рекламными системами Mail.Ru и проектом top.mail.ru. Все три наших проекта достаточно специфичные, потому что мы не обладаем никаким юзер контентом, мы в основном паразитируем на вас, как пользователях, и особенность наша заключается в том, что у нас очень большие PPS на фронтах, что не у многих проектов есть. Т.е. у таких проектов, как Одноклассники, как ВКонтакте, это понятно, потому что они просто огромные, у более мелких проектов такого нет. А мы размещаемся на всех вышеперечисленных и на всех страницах Mail.Ru, поэтому наш PPS еще больше, чем у этих проектов.
Читать полностью »

Визуальный мониторинг серверной инфраструктуры на базе Nagios + Grafana

2016-08-29 в 11:46, admin, рубрики: carbon, Grafana, Graphios, graphite, nagios, NRPE, Whisper, ит-инфраструктура, Серверное администрирование, метки: NRPE

nagios + grafana

Мы в Атласе любим, когда все находится под контролем. Это касается и всей серверной инфраструктуры, которая, с годами, превратилась в живой организм из многочисленных виртуальных машин, сервисов и служб. Появилась потребность наблюдать за жизненно важными аспектами IT-составляющей нашей деятельности: мониторить боевой сервер, отслеживать изменения системных ресурсов на виртуалках баз данных, следить за ходом бизнес-процессов и тд. Встал вопрос — как же этого добиться и главное какими инструментами? Стали искать какие-то готовые решения. Перепробовали кучу платных/бесплатных сервисов, которые, якобы, предоставляли бы нам "самую ценную" информацию о состоянии нашей системы. Но, в конечном итоге, все сводилось к каким-то непонятных диаграммам, схемам и цифрам, которые, по сути, для нас не имели никакой ценности.

Так мы пришли к пониманию, что надо собирать что-то самостоятельно. За основу решили взять самую гибкую и продвинутую систему, которую можно настроить для мониторинга чего и как угодно — Nagios. Настроили, поставили, работает — круто! Жаль только интерфейс сего чуда застрял где-то в середине 90-х, а нам хотелось, чтобы еще и визуальная составляющая была на уровне.

Недолгий поиск показал, что лидером среди решений по созданию красивых дашбордов является Grafana. Так и решили выводить весь наш мониторинг из Nagios на мониторах в виде красивых графиков в Grafana. Вопрос остался только в том — как их подружить друг с другом?

Читать полностью »

Установка связки Carbon + Graphite + Grafana + Nginx + MySQL для сбора и отображения метрик в Ubuntu

2016-06-06 в 15:15, admin, рубрики: carbon, Grafana, graphite, mysql, nginx

Хочу поделиться опытом установки и настройки сервиса для сбора и отображения метрик Graphite + Grafana.
Искал долго, читал много, нашёл 2 статьи на английском, добавил своё, в итоге получилась данная статья.

Немного предыстории..

Graphite — система для отображения метрик (числовых значений) для любых свойств сервера или домашнего ПК.

Carbon — демон/бэкенд, в который пишутся метрики.

Grafana — более красивая и удобная Web-морда для Graphite.

И так, приступим.

Читать полностью »

Moira: Realtime Alerting

2016-02-02 в 9:28, admin, рубрики: alerting, Go, graphite, moira, monitoring, python, riemann, Seyren, Блог компании СКБ Контур, Разработка под Linux, системное администрирование, метки: moira

Moira: Realtime Alerting - 1
Контур делает несколько десятков продуктов, каждый из которых состоит из нескольких десятков микросервисов, каждый из которых запущен на десятках серверов.

Эта инфраструктура порождает метрики на всех технологических уровнях — нагрузка на железо, состояние ОС, метрики приложений. Исходные данные собираются в один большой кластер Graphite. Сейчас у нас есть миллион уникальных метрик, по которым суммарно генерируется 20 тысяч значений в секунду.

Ясно, что за миллионом метрик не уследить глазами на телевизорах и дашбордах — нужна система отправки уведомлений о нештатных ситуациях. Перед тем как написать свою систему Moira, мы использовали для этой задачи Seyren.
Читать полностью »

В поисках идеального мониторинга

2015-03-12 в 13:58, admin, рубрики: Diamond, Grafana, graphite, Seyren, Блог компании Тинькофф Банк, графики и диаграммы, Серверное администрирование, системное администрирование, метки: Diamond, Grafana, Graphite, Seyren

В этой небольшой статье я хотел бы рассказать о средствах мониторинга, использующихся для анализа работы DWH нашего банка. Статья будет интересна всем, кого не устраивают существующие готовые системы мониторинга и кого посещали мысли собрать таковую «под себя» из отдельных кусочков. Большое внимание в статье уделяется дашборду Grafana, который, по моему мнению, незаслуженно обделён вниманием на Хабре. По большинству компонентов системы мониторинга будет вкратце рассмотрен процесс инсталяции (под RedHat).

В поисках идеального мониторинга - 1
Тёплый ламповый дашборд
Читать полностью »

Проект Dual ETL или как мы строили Disaster Recovery для Greenplum

2015-01-28 в 17:05, admin, рубрики: big data, dba, disaster recovery, dwh, etl, graphana, graphite, greenplum, sas, sql, Администрирование баз данных, Блог компании Тинькофф Кредитные Системы, хранение данных

В этой статье я хочу рассказать про ещё один этап развития DWH в Тинькофф Банке.

Ни для кого не секрет, что требования к наличию Disaster Recovery (далее DR) в современных бизнес информационных системах относятся к категории «must have». Так, чуть более года назад, команде, занимающейся развитием DWH в банке, была поставлена задача реализовать DR для DWH, на котором построены как offline, так и online процессы банка.

Проект Dual ETL или как мы строили Disaster Recovery для Greenplum - 1

Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «graphite»

Сбор статистики MTProto Proxy

Предыстория

Хранение метрик: как мы перешли с Graphite+Whisper на Graphite+ClickHouse

Как обложить сервис метриками и не облажаться

Какие бывают метрики?

Мониторинг как сервис: модульная система для микросервисной архитектуры

Обзор архитектуры и подсистем деплоя и мониторинга. Как инженеры делают систему прозрачной для разработки

Константин Никифоров ( melazyk )

Визуальный мониторинг серверной инфраструктуры на базе Nagios + Grafana

Установка связки Carbon + Graphite + Grafana + Nginx + MySQL для сбора и отображения метрик в Ubuntu

Moira: Realtime Alerting

В поисках идеального мониторинга

Проект Dual ETL или как мы строили Disaster Recovery для Greenplum

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «graphite»

Предыстория

Какие бывают метрики?

Константин Никифоров ( melazyk )

Новости

Актуальные темы

Архив