Рубрика «tracing»

Uptrace v2.0: как новый JSON-тип ClickHouse ускорил запросы по трейсам в 10 раз

2025-10-16 в 8:47, admin, рубрики: clickhouse, devops, distributed tracing, observability, opentelemetry, tracing, микросервисы, производительность

Делюсь практическим опытом внедрения Uptrace v2.0 — от разворачивания до оптимизации запросов. С цифрами, кодом и реальными кейсами.

TL;DR

Uptrace v2.0 использует новый JSON-тип ClickHouse для хранения трейсов, что даёт 10x ускорение запросов. Показываю на практике: установка за 5 минут, настройка трансформаций данных, экономия на retention policies. Бенчмарки на 500M span'ах: запросы стали выполняться за 0.3-0.5 сек вместо 4-7 сек.

Почему я вообще это затеял

Читать полностью »

Circuit Tracing: как заглянуть в галлюцинации модели и найти там смысл

2025-09-26 в 18:30, admin, рубрики: circuit, llm, rag, tracing, transcoder, атрибуционная модель данных, галлюцинации, граф, детектор, интерпретируемость

Читать полностью »

Jaeger v2

2025-06-29 в 21:36, admin, рубрики: backend, jaeger, jaeger v2, python, tracing

Появилась у меня задача по мониторингу и оценке производительности проекта на микросервисной архитектуре. Для решения был выбран Jaeger. Он давно на рынке, активно развивается (не так давно вышла версия 2, в которой упростилось развертывание и появилась интеграция OpenTelemetry). На мой взгляд, Jaeger – отличное решение для трейсинга, но документация ощущается как не до конца собранный пазл: важные вещи разбросаны, а для понимания приходится обращаться к исходному коду или искать примеры в GitHub-репозиториях.

Цель данной статьи показать на практике, как внедрить Jaeger в продукт на микросервисах.

Читать полностью »

Трейсинг в Go — это просто

2023-01-15 в 2:55, admin, рубрики: Go, golang, opentelemetry, tracing

В эпоху быстрорастущих сервисов важно иметь возможность контролировать состояние системы в любой момент времени. Одними из инструментов для достижения этого являются логи и метрики, которые помогают нам следить за многими параметрами, такими как количество запросов в секунду (RPS), потребление памяти, процент закешированных вызовов и так далее. Иными словами, логи и метрики добавляют нашей системе такую важную характеристику, как наблюдаемость (Observability)

Наблюдаемость позволяет нам легко устранять баги и решать новые проблемы, отвечая на вопрос "Почему это происходит?".

Читать полностью »

BpfTrace — наконец, полноценная замена Dtrace в Linux

2020-05-05 в 12:00, admin, рубрики: bpftrace, devops, DTrace, eBPF, linux, open source, tracing, Блог компании Конференции Олега Бунина (Онтико), высокая производительность, Настройка Linux, системное администрирование

Бывает, что системы глючат, тормозят, ломаются. Чем больше система, тем сложнее найти причину. Чтобы узнать, почему что-то работает не так, как ожидалось, исправить или предотвратить будущие проблемы, нужно посмотреть внутрь. Для этого системы должны обладать свойством наблюдаемости, которая достигается инструментацией в широком смысле этого слова.

На HighLoad++ Пётр Зайцев (Percona) сделал обзор доступной инфраструктуры для трейсинга в Linux и рассказал о bpfTrace, который (как видно из названия) дает много преимуществ. Мы сделали текстовую версию доклада, чтобы вам было удобно пересмотреть детали и дополнительные материалы всегда были под рукой.
Читать полностью »

Netramesh – легковесное service mesh решение

2019-04-30 в 12:18, admin, рубрики: docker, Go, kubernetes, observability, tracing, Облачные вычисления, системное администрирование

В процессе перехода от монолитного приложения к микросервисной архитектуре мы сталкиваемся с новыми проблемами.

В монолитном приложении обычно достаточно просто определить, в какой части системы произошла ошибка. Скорее всего, проблема в коде самого монолита, либо в базе данных. Но когда мы начинаем искать проблему в микросервисной архитектуре, всё уже не так очевидно. Нужно найти весь путь, который прошел запрос от начала до конца, выделить его из сотен микросервисов. Причём многие из них еще и имеют собственные хранилища, в которых также могут возникать как логические ошибки, так и проблемы с производительностью и отказоустойчивостью.

Netramesh – легковесное service mesh решение - 1

Я долго искал инструмент, который помог бы справиться с такими проблемами (писал об этом на Хабре: 1, 2), но в итоге сделал собственное опенсорсное решение. В статье я рассказываю о преимуществах подхода service mesh и делюсь новым инструментом для его реализации.

Читать полностью »

NodeJS logging made right

2019-03-03 в 8:30, admin, рубрики: async_hooks, CLS, cls-proxify, javascript, logging, node.js, nodejs, proxy, tracing

NodeJS logging made right - 1

What's nagging you the most when you think about logging in NodeJS? If you ask me I'm gonna say lack of of industry standards for creating trace IDs. Within this article we'll overview how we can create these trace IDs (meaning we're going to briefly examine how continuation local storage a.k.a CLS works) and dig deep into how we can utilize Proxy to make it work with ANY logger.

Читать полностью »

Istio и Kubernetes в production. Часть 2. Tracing

2018-12-20 в 10:50, admin, рубрики: devops, Istio, jaeger, service mesh, tracing, zipkin, системное администрирование

В прошлой статье мы рассмотрели базовые компоненты Service Mesh Istio, познакомились с системой и ответили на основные вопросы, которые обычно возникают в начале работы с Istio. В этой части мы посмотрим на то, как организовать сбор tracing информации по сети.

Istio и Kubernetes в production. Часть 2. Tracing - 1
Читать полностью »

Как запустить Istio, используя Kubernetes в production. Часть 1

2018-08-23 в 11:11, admin, рубрики: devops, envoy, injecting, Istio, kubernetes, service mesh, tracing, Блог компании Avito, Облачные вычисления, Серверное администрирование, системное администрирование

Что такое Istio? Это так называемый Service mesh, технология, которая добавляет уровень абстракции над сетью. Мы перехватываем весь или часть трафика в кластере и производим определенный набор операций с ним. Какой именно? Например, делаем умный роутинг, или реализуем подход circuit breaker, можем организовывать «canary deployment», частично переключая трафик на новую версию сервиса, а можем ограничивать внешние взаимодействия и контролировать все походы из кластера во внешнюю сеть. Есть возможность задавать policy правила для контроля походов между разными микросервисами. Наконец, мы можем получить всю карту взаимодействия по сети и сделать унифицированный сбор метрик полностью прозрачно для приложений.

Про механизм работы можно прочитать в официальной документации. Istio — это действительно мощный инструмент, который позволяет решить множество задач и проблем. В этой статье я бы хотел ответить на основные вопросы, которые обычно возникают в начале работы с Istio. Это поможет вам разобраться с ним быстрее.

Как запустить Istio, используя Kubernetes в production. Часть 1 - 1

Читать полностью »

Трассировка и Javascript

2018-06-10 в 17:53, admin, рубрики: chrome devtools, Google Chrome, http, javascript, node.js, performance analysis, tracing, Серверная оптимизация

Трассировка и Javascript - 1

Когда-нибудь трассировали рантайм вашего приложения? Знаете сколько запросов делает вон тот серый ендпоинт, который? А как долго вычитываются те кросс-референсы на схожий тип ресурсов с каждой странички сущностей, которую нужно вернуть в запрос? Пытались ли вы замерить как долго приходится ждать пользователю из-за опциональных полей запроса, которые он время от времени добавляет? Задумывались ли вы что будет если запараллелизировать эти шесть запросов к тем двум базам данных?

Если что-нибудь выше звучит интересно, или как минимум знакомо — добро пожаловать под кат.
Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «tracing»

Uptrace v2.0: как новый JSON-тип ClickHouse ускорил запросы по трейсам в 10 раз

Почему я вообще это затеял

Circuit Tracing: как заглянуть в галлюцинации модели и найти там смысл

Jaeger v2

Трейсинг в Go — это просто

BpfTrace — наконец, полноценная замена Dtrace в Linux

Netramesh – легковесное service mesh решение

NodeJS logging made right

Istio и Kubernetes в production. Часть 2. Tracing

Как запустить Istio, используя Kubernetes в production. Часть 1

Трассировка и Javascript