Рубрика «Grafana»

ASOC from scrap. Как реализовать автоматизацию DevSecOps контролей за несколько вечеров, используя OpenSource и LLM

2026-06-29 в 7:45, admin, рубрики: appsec, asoc, devops, fastapi, Grafana, postgresql, python, безопасная разработка

Рубрика: «Очумелые ручки»

Привет! Сегодня я хочу поделиться своим опытом разработки ASOC платформы.

В статье я расскажу о преимуществах такого решения, затем опишу особенности реализации всех ключевых компонентов. Моя цель показать, что разработка собственных ИБ инструментов сегодня не является сложной задачей и, возможно, вдохновить кого‑то на самостоятельное улучшение практик AppSec и DevSecOps в своей компании.

Дисклеймер

Прошу внимания. Спасибо за внимание!

Читать полностью »

Loki «Next Wave»: как Grafana Labs переписала правила логирования на GrafanaCON 2026

2026-05-02 в 19:16, admin, рубрики: Grafana, logs, loki, observability, логи

Всем привет. В этой статье будет много текста, мало цифр с пруфами, пока что более поверхностный разбор, но я думаю тем кто упустил GrafanaCON 2026 это будет интересно.

Маленький спойлер для начала

Читать полностью »

Простой мониторинг Synology NAS с Grafana и Prometheus

2026-05-01 в 12:15, admin, рубрики: DSM, Grafana, NAS, prometheus, self-hosted, snmp, synology nas, домашний сервер, мониторинг сервера

Всем привет! Храню 7 терабайт фото и видео у себя дома на Synology DS224+ с DSM 7.3+

Это сетевое хранилище поддерживает Docker. Я дополнительно установил плашку памяти и теперь у меня 18 ГБ ОЗУ.

Но суть в том, что ночами я слышу «булькание» и «шуршание» дисков, кстати диски красные, прямо созданные под сетевые хранилища: WD120EFBX-68B0EN0 две штуки по 12 ТБ с зеркалированием.

И у меня возник такой страх, а что если мои файлы что-то форматирует, а я просто лежу и не знаю об этом. И я начал поиски репозиториев на GitHub, посмотрел как делают другие, мне как обычно ничего не подошло и я решил создать свой проект, который полностью меня устраивает.

Читать полностью »

Как перестать терять данные в Kafka: окно безопасности и проактивный мониторинг «возраста» данных

2026-04-07 в 13:24, admin, рубрики: Data Infrastructure, data loss, devops, Grafana, monitoring, observability, platform engineering, retention, sre

В современных Data-driven компаниях Kafka называют «центральной нервной системой» данных. Но даже идеально настроенный кластер может стать причиной Data Loss, если конфигурация инфраструктуры не синхронизирована с реальностью бизнес-потоков. В этой статье я поделюсь кейсом из практики Platform Engineer: как неочевидный конфликт настроек приводил к потерям данных и как я решил это, внедрив метрику «Data Safety Window».

Проблема: «Дырки» в данных при плановых работах

Читать полностью »

Observability своими руками: затаскиваем Prometheus, Loki и Grafana в Go-стартап на бесплатный VPS

2026-02-18 в 5:15, admin, рубрики: dashboard, Go, golang, Grafana, loki, metrics, observability, prometheus, start-up, стартап

Я Go-разработчик из крупной Bigtech-компании и один из основателей ИИ-помощника по налаживанию отношений Ближе. По сути это телеграм-бот, который принимает вопрос от пользователя по long-polling модели, обогащает его промтом, идёт в LLM, получает ответ, отправляет обратно пользователю. Контекст диалога и пользователи хранятся в Postgres, всего один инстанс приложения на Go, также cron, который отправляет уведомления с просьбой оставить обратную связь о продукте. Docker Compose для запуска нескольких контейнеров.

Читать полностью »

Как мы учили ИИ тушить инциденты вместо нас (что из этого вышло)

2025-12-24 в 8:16, admin, рубрики: AI, devops, Grafana, kubernetes, OpenAI, инфраструктура, искусственный интеллект, исследование, сезон ии в разработке

Привет, меня зовут Артем, я тимлид DevOps в одной аутстафф-компании. Столкнулись с классической ситуацией: десятки микросервисов, Kubernetes, куча observability-стека (Prometheus, Loki, Tempo, Grafana) и... постоянные ночные инциденты. «High CPU», «Pod CrashLoopBackOff», «5xx errors rising».

У нас есть runbooks, документация, скрипты для быстрого доступа к логам. Но в 3 ночи, когда срабатывает критический алерт, тратишь время на то, чтобы проснуться, сообразить, куда залогиниться и какую команду выполнить… Мы задались вопросом: а если первым на инцидент будет реагировать не человек, а ИИ-агент?

⠀⠀

Боль, которую мы хотели решить:

1. Читать полностью »

Grafana + Prometheus для Bitrix: один экран, чтобы видеть и «железо», и продукт

2025-11-16 в 14:15, admin, рубрики: 1c-битрикс, exporter, Grafana, prometheus, бизнес-метрики, визуализация

Сайт работает, 500-ых нет – но заказы с сайта не поступают. Бизнес теряет деньги, а разработчики даже не подозревают что что-то идет не так. Меня зовут Михаил, я из команды Backend разработки D'Terra. Мы прошли через это и поняли: только system-based метрик недостаточно. Нам нужны бизнес метрики в дашбордах, что бы реагировать на такие инциденты. Поэтому я настроили Prometheus под Bitrix так, чтобы на одном дашборде видеть и «железо», и бизнес-часть сайта.

Принципы работы

Читать полностью »

OpenTelemetry — не то, чем кажется…

2025-11-11 в 15:15, admin, рубрики: aop, Grafana, java, kibana, kotlin, monitoring, opentelemetry

Привет! Меня зовут - Евгений, работаю в финтехе и проектирую системы, которые обрабатывают миллионы запросов, интегрируются с десятками внешних сервисов и живут в Kubernetes. А еще я преподаю Java/Spring Boot и рассказываю студентам, как не наступать на чужие грабли, а создавать свои и прыгать на них.

Читать полностью »

Нагрузочное тестирование K6 (Концепт)

2025-11-09 в 6:15, admin, рубрики: Grafana, K6, performance tests, qa

Наша система хорошо покрыта unit-тестами, которые интегрированы в CI-процессы. Настроен запуск и контроль функциональных интеграционных тестов. После проделанной работы по обеспечению корректности выполнения бизнес-процессов возникли вопросы, связанные с производительностью, корректностью настройки компонентов системы, отказоустойчивостью, которые можно условно обрисовать, выделив основные из них:

Насколько корректно и оптимально настроены все модули системы?
Где порог отказоустойчивости наших сервисов и сторонних компонентов, используемых в решении?
Читать полностью »

Observability в мире Интернета вещей

2025-08-29 в 5:51, admin, рубрики: Grafana, IoT, observability, opentelemetry, Интернет вещей, логи, метрики, наблюдаемость, трассировки

Мониторинг и наблюдение жизненно важны для поддержания надежности, эффективности и безопасности устройств Интернета вещей. При правильном подходе они обеспечивают обзор ваших систем Интернета вещей в режиме реального времени, а также доступ к данным, необходимым для устранения проблем, связанных с историей. Однако при наличии тысяч разнообразных устройств IoT достижение этих целей сопряжено со множеством сложностей.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «Grafana»

ASOC from scrap. Как реализовать автоматизацию DevSecOps контролей за несколько вечеров, используя OpenSource и LLM

Рубрика: «Очумелые ручки»

Loki «Next Wave»: как Grafana Labs переписала правила логирования на GrafanaCON 2026

Простой мониторинг Synology NAS с Grafana и Prometheus

Как перестать терять данные в Kafka: окно безопасности и проактивный мониторинг «возраста» данных

Проблема: «Дырки» в данных при плановых работах

Observability своими руками: затаскиваем Prometheus, Loki и Grafana в Go-стартап на бесплатный VPS

Как мы учили ИИ тушить инциденты вместо нас (что из этого вышло)

Боль, которую мы хотели решить:

Grafana + Prometheus для Bitrix: один экран, чтобы видеть и «железо», и продукт

Принципы работы

OpenTelemetry — не то, чем кажется…

Нагрузочное тестирование K6 (Концепт)

Observability в мире Интернета вещей