Рубрика «latency»

Иллюзия памяти: как индустрия десятилетиями маскировала ограничения железа

2026-05-12 в 13:01, admin, рубрики: cxl, distributed systems, HBM, latency, raid, redis, ruvds_статьи, виртуальная память, кэширование, память

Читать полностью »

Голосовой агент — это не чатбот с телефоном: 40 часов экономии и $100, сожженные на ботах

2026-05-04 в 10:45, admin, рубрики: ElevenLabs, latency, llm, OpenClaw, Retell, STT, TTS, Twilio, voice agents, голосовые агенты

Я однажды примерно за сутки сжег около $100 на голосовом агенте.

Не на большом запуске. Не на огромной базе. Не на хитрой рекламной кампании. Просто на небольшом пуле холодных контактов, где агент периодически попадал на voicemail, IVR, секретарей и других ботов.

В какой-то момент два не очень умных голосовых процесса могли довольно долго вежливо говорить друг другу что-то в духе:

Здравствуйте.

Здравствуйте, чем могу помочь?

Я звоню, чтобы…

Здравствуйте, чем могу помочь?

Конечно, подскажите, пожалуйста…

Читать полностью »

Как одна буква в ассемблере стоит 3× производительности

2026-04-17 в 19:16, admin, рубрики: assembly, div, latency, nasm, partial register merge, Skylake, throughput, x86, микроархитектура, оптимизация

Я хочу показать вам, как одна буква в ассемблере может стоить 3× производительности. Не в теории — на живых замерах. По дороге мы заглянем внутрь процессора: Register Alias Table, partial register merge, scheduler, latency vs throughput, и даже обнаружим, что делитель выдаёт остаток раньше частного.

Но начнём с основ. Приготовьтесь: кроличья нора окажется глубже, чем кажется.

Немного контекста

Процессор x86-64 работает с регистрами — быстрыми ячейками прямо внутри CPU. Их немного (16 основных), зато доступ к ним — за доли такта, в отличие от оперативной памяти, где задержка может достигать сотен тактов.

Главный нюанс: у каждого регистра есть Читать полностью »

Мы знаем как готовить БД. Но индустрия изменилась: что бы я заложил в OLTP-БД с нуля

2026-02-24 в 13:15, admin, рубрики: latency, MVCCAutovacuum, oltp, postgresql, sql server, Администрирование баз данных, базы данных

Всю профессиональную карьеру я так или иначе жил рядом с базами данных: начинал с Oracle, потом надолго перешёл на MS SQL Server и PostgreSQL (думаю, я здесь не один такой).

Обычно мы используем СУБД как инструмент: учитываем нюансы синтаксиса, оптимизатора, утилит и поведения движка — и решаем прикладные задачи. Но недавно, разворачивая очередной PostgreSQL‑кластер для продакшена, я поймал себя на мысли: не слишком ли много всего нужно поднять вокруг PostgreSQL, чтобы система работала одновременно безопасно и предсказуемо по производительности?

Читать полностью »

Когда стойка умирает, а 5xx остаётся нулевым. Разбор скрытой деградации PostgreSQL

2026-02-20 в 18:45, admin, рубрики: haproxy, latency, pgbouncer, postgresql, retry, sre, Tor, деградация, инцидент, отказоустойчивость

Иногда инцидент начинается не с 5xx и не с красного графика

Он начинается с одной стойки

И с одного таймаута

09:12 - alert: db-replica-02 connection timeout

HAProxy зелёный
HTTP 5xx = 0.2%
p50 = 38–42ms

2 стойки
В каждом свой ToR
Primary и app в rack-1
Replica-01 в rack-1
Replica-02 в rack-2

Читать полностью »

Три кита масштабируемого IT-продукта: закон больших чисел, теория вероятностей и статистика

2026-02-02 в 8:05, admin, рубрики: latency, p-value, slo, timeweb_статьи, закон больших чисел, статистика, теория вероятностей

Привет! В каждой компании есть люди, которые не пишут код каждый день, но почти каждый день принимают решения, от которых этот код либо спокойно живёт под нагрузкой, либо превращается в источник инцидентов и срочных созвонов. Думаю они согласятся, что масштабируемые IT-продукты строятся не только на технологиях, а ещё и на умении мыслить вероятностно.

Когда в команде спорят о фичах, производительности или надёжности, я редко слышу принципиально разные аргументы. Чаще это разные формы одного и того же:

-Мне кажется, пользователям понравится.
-Я уверен, что система выдержит.
-Читать полностью »

BBRv3, FEC и QUIC: как мы удержали jitter <1 мс и стабилизировали RU<->EU

2025-11-09 в 13:15, admin, рубрики: bbrv3, HTTP3, latency, masque, QUIC, rfc, Алгоритмы, оптимизация, сетевые_технологии

Мы стабилизировали QUIC на реальных RU↔EU трассах: jitter <1 мс PoP↔PoP, P50 ~20–21 мс RU↔EU (end-to-end). Помогли BBRv3 с динамическим pacing, HTTP/3 Datagrams/MASQUE (RFC 9297/9298/9484) и экспериментальный FEC. На профиле 5% потерь при включенном FEC видим ~+10% goodput (recovery валидируем group-aligned тестом). Ниже - методика, цифры и репликация. Замеры - для наших RU↔EU путей (октябрь 2025), на других трассах цифры могут отличаться. Все тесты проводились на реальных Edge PoP узлах CloudBridge (Moscow, Frankfurt, Amsterdam) с использованием собственного инструмента quic-test.

1. Введение

Читать полностью »

Маршрутизация LLM: оптимизация путей обработки языка

2025-11-06 в 11:30, admin, рубрики: AI, artificial intelligence, data augmentation, latency, llm, llm-модели, MTBench, маршрутизация запросов

Повышение эффективности и производительности через инновационные стратегии маршрутизации.

Что такое LLM Routing?

В стремительно развивающемся мире искусственного интеллекта большие языковые модели (LLM)Читать полностью »

Мнение: рационализация конкуренции за низкую задержку в высокочастотной торговле

2024-12-20 в 10:21, admin, рубрики: HFT, latency, биржевая торговля, высокочастотная торговля, задержка, фондовый рынок

Читать полностью »

Конвейеризация: универсальный способ повышения пропускной способности

2024-12-02 в 19:15, admin, рубрики: golang, latency, pipeline, throughput, архитектура приложений, архитектура процессоров, архитектура систем, конвейер, микросервисы, пропускная способность

Что общего между стиральной машиной, CPU и микросервисами? Все они выигрывают от «конвейеризации» (англ. pipelining).

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «latency»

Иллюзия памяти: как индустрия десятилетиями маскировала ограничения железа

Голосовой агент — это не чатбот с телефоном: 40 часов экономии и $100, сожженные на ботах

Как одна буква в ассемблере стоит 3× производительности

Немного контекста

Мы знаем как готовить БД. Но индустрия изменилась: что бы я заложил в OLTP-БД с нуля

Когда стойка умирает, а 5xx остаётся нулевым. Разбор скрытой деградации PostgreSQL

Три кита масштабируемого IT-продукта: закон больших чисел, теория вероятностей и статистика

BBRv3, FEC и QUIC: как мы удержали jitter <1 мс и стабилизировали RU<->EU

1. Введение

Маршрутизация LLM: оптимизация путей обработки языка

Что такое LLM Routing?

Мнение: рационализация конкуренции за низкую задержку в высокочастотной торговле

Конвейеризация: универсальный способ повышения пропускной способности