Я Go-разработчик из крупной Bigtech-компании и один из основателей ИИ-помощника по налаживанию отношений Ближе. По сути это телеграм-бот, который принимает вопрос от пользователя по long-polling модели, обогащает его промтом, идёт в LLM, получает ответ, отправляет обратно пользователю. Контекст диалога и пользователи хранятся в Postgres, всего один инстанс приложения на Go, также cron, который отправляет уведомления с просьбой оставить обратную связь о продукте. Docker Compose для запуска нескольких контейнеров.
Рубрика «observability»
Observability своими руками: затаскиваем Prometheus, Loki и Grafana в Go-стартап на бесплатный VPS
2026-02-18 в 5:15, admin, рубрики: dashboard, Go, golang, Grafana, loki, metrics, observability, prometheus, start-up, стартап«Вроде всё правильно, но не работает»: как я перестал дебажить “на глаз” и собрал evidence-first пайплайн
2026-02-15 в 19:15, admin, рубрики: devops, docker, evidence, fastapi, healthcheck, observability, powershell, smoke test, диагностикаЕсть типичная боль: ты вроде всё сделал правильно — контейнеры поднялись, API отвечает, UI открывается… а потом оказывается, что “не работает”. Причём не “сломано в пепел”, а именно “почти”: где-то 404, где-то таймаут, где-то UI открывается, но вкладки пустые, где-то один запрос проходит, другой — молчит.
И самое неприятное: когда начинаешь чинить “по ощущениям”, можно потратить часы, а потом выяснить, что причина была не в коде, а в порте, origin, IPv6, миграциях или в том, что UI ходит не туда.
Я перестал спорить с реальностью и сделал себе простой подход evidence-first:
Uptrace v2.0: как новый JSON-тип ClickHouse ускорил запросы по трейсам в 10 раз
2025-10-16 в 8:47, admin, рубрики: clickhouse, devops, distributed tracing, observability, opentelemetry, tracing, микросервисы, производительностьДелюсь практическим опытом внедрения Uptrace v2.0 — от разворачивания до оптимизации запросов. С цифрами, кодом и реальными кейсами.
TL;DR
Uptrace v2.0 использует новый JSON-тип ClickHouse для хранения трейсов, что даёт 10x ускорение запросов. Показываю на практике: установка за 5 минут, настройка трансформаций данных, экономия на retention policies. Бенчмарки на 500M span'ах: запросы стали выполняться за 0.3-0.5 сек вместо 4-7 сек.
Почему я вообще это затеял
HTTP-3 и QUIC: почему интернет обновляется, и что это даёт приложениям
2025-09-19 в 13:01, admin, рубрики: CDN, HTTP3, observability, QUIC, ruvds_статьи, tls1.3, мобильность, производительность, сети
Представьте, что дороги в вашем городе заменили за ночь: больше нет светофоров на каждом перекрёстке, машины едут быстрее, а пробки исчезают сами собой.
Observability в мире Интернета вещей
2025-08-29 в 5:51, admin, рубрики: Grafana, IoT, observability, opentelemetry, Интернет вещей, логи, метрики, наблюдаемость, трассировкиМониторинг и наблюдение жизненно важны для поддержания надежности, эффективности и безопасности устройств Интернета вещей. При правильном подходе они обеспечивают обзор ваших систем Интернета вещей в режиме реального времени, а также доступ к данным, необходимым для устранения проблем, связанных с историей. Однако при наличии тысяч разнообразных устройств IoT достижение этих целей сопряжено со множеством сложностей.
Как я перестал тушить пожары и начал говорить с бизнесом на языке SLO
2025-08-26 в 9:16, admin, рубрики: alerting, devops, Error budget, monitoring, observability, sli, slo, sre, постмортемГорящие релизы и ночные дежурства: мой персональный ад
Когда я пришёл на проект, всё было похоже на нескончаемый пожар. В продакшене сыпались алерты один за другим, CI/CD-пайплайны (GitLab и Jenkins) постоянно фейлили, а релизы проходили хаотично — каждый новый билд мог «уложить» сервис. Я пил кофе в три ночи, когда прозвучал очередной звонок на мобильник: «сервис упал — немедленно разбирайся!». MTTR (Mean Time To Recovery)Читать полностью »
Контентный модуль APM на OpenTelemetry — архитектура, метрики, выводы
2025-08-03 в 6:15, admin, рубрики: inventory, Microservices, monitoring, observability, opensearch, opentelemetry, span, traceОбо мне
Внедрял SIEM-системы и системы комплексного мониторинга. Подключал и парсил источники, нормализировал события различных доменов данных. Сейчас занимаюсь анализом данных, разработкой контентных модулей для решения задач мониторинга и информационной безопасности в компании VolgaBlob.
Вводная информация
Ознакомившись с опытом использования трассировок для мониторинга микросервисных архитектур от сообщества и крупных игроков в области Observability (DataDog):
Использование метрик для мониторинга облачных баз данных на примере PostgreSQL
2025-07-19 в 8:00, admin, рубрики: DBaaS, Grafana, observability, postgresql, prometheus, selectel, базы данных, облако
Если вы работаете с базами данных, то вам определенно стоит иметь понимание о производительности кластера СУБД. Для этого можно использовать базовые метрики. А можно — метрики Читать полностью »
Как сделать централизованное логирование и крепко спать по ночам
2025-04-22 в 12:00, admin, рубрики: highload, logging, observability, opensearch, архитектура, геораспределенность, логирование, наблюдаемость, ПлатформаПривет! На связи Филипп Бочаров, руководитель платформы наблюдаемости и мониторинга для более 400 продуктов экосистемы МТС, и Юлия Тальцкова, ведущий инженер сервиса логирования и кластеров Open Search с более 400 терабайтами логов клиентов. Этот материал написан на основе нашего доклада для конференции Highload++.
Расскажем, как нам удалось переписать критичный и высоконагруженный сервис логирования, перестать просыпаться от ночных звонков и даже иногда уходить в отпуск.
Чтобы было понятнее, с какими трудностями столкнулись, поделимся некоторыми цифрами экосистемы.
Сервис логирования — это:
Deckhouse Prom++: мы добавили плюсы к Prometheus и сократили потребление памяти в 7,8 раза
2025-03-26 в 10:25, admin, рубрики: deckhouse, deckhouse prom++, devops, kubernetes, observability, open source, prometheusPrometheus для хранения 1 миллиона метрик, собираемых раз в 30 секунд на протяжении 2 часов, требуются 500 МБ на диске и 5 ГБ памяти. Нам показалось, что это слишком много. Вместо этого хотелось получить «бесплатный» мониторинг, который не будет требовать значительных затрат на инфраструктуру.
Больше двух лет мы работали над этой задачей. Её результатом стал Deckhouse Prom++. Это Open Source-система мониторинга, которой в среднем требуется в 7,8 раза меньше памяти и в 2,2 раза меньше ресурсов CPU, чем Prometheus v2.53. И здесь ещё есть пространство для оптимизации.
