Рубрика «latency»
Иллюзия памяти: как индустрия десятилетиями маскировала ограничения железа
2026-05-12 в 13:01, admin, рубрики: cxl, distributed systems, HBM, latency, raid, redis, ruvds_статьи, виртуальная память, кэширование, памятьГолосовой агент — это не чатбот с телефоном: 40 часов экономии и $100, сожженные на ботах
2026-05-04 в 10:45, admin, рубрики: ElevenLabs, latency, llm, OpenClaw, Retell, STT, TTS, Twilio, voice agents, голосовые агентыЯ однажды примерно за сутки сжег около $100 на голосовом агенте.
Не на большом запуске. Не на огромной базе. Не на хитрой рекламной кампании. Просто на небольшом пуле холодных контактов, где агент периодически попадал на voicemail, IVR, секретарей и других ботов.
В какой-то момент два не очень умных голосовых процесса могли довольно долго вежливо говорить друг другу что-то в духе:
Здравствуйте.
Здравствуйте, чем могу помочь?
Я звоню, чтобы…
Здравствуйте, чем могу помочь?
Конечно, подскажите, пожалуйста…
Как одна буква в ассемблере стоит 3× производительности
2026-04-17 в 19:16, admin, рубрики: assembly, div, latency, nasm, partial register merge, Skylake, throughput, x86, микроархитектура, оптимизацияЯ хочу показать вам, как одна буква в ассемблере может стоить 3× производительности. Не в теории — на живых замерах. По дороге мы заглянем внутрь процессора: Register Alias Table, partial register merge, scheduler, latency vs throughput, и даже обнаружим, что делитель выдаёт остаток раньше частного.
Но начнём с основ. Приготовьтесь: кроличья нора окажется глубже, чем кажется.
Немного контекста
Процессор x86-64 работает с регистрами — быстрыми ячейками прямо внутри CPU. Их немного (16 основных), зато доступ к ним — за доли такта, в отличие от оперативной памяти, где задержка может достигать сотен тактов.
Главный нюанс: у каждого регистра есть Читать полностью »
Мы знаем как готовить БД. Но индустрия изменилась: что бы я заложил в OLTP-БД с нуля
2026-02-24 в 13:15, admin, рубрики: latency, MVCCAutovacuum, oltp, postgresql, sql server, Администрирование баз данных, базы данныхВсю профессиональную карьеру я так или иначе жил рядом с базами данных: начинал с Oracle, потом надолго перешёл на MS SQL Server и PostgreSQL (думаю, я здесь не один такой).
Обычно мы используем СУБД как инструмент: учитываем нюансы синтаксиса, оптимизатора, утилит и поведения движка — и решаем прикладные задачи. Но недавно, разворачивая очередной PostgreSQL‑кластер для продакшена, я поймал себя на мысли: не слишком ли много всего нужно поднять вокруг PostgreSQL, чтобы система работала одновременно безопасно и предсказуемо по производительности?
Когда стойка умирает, а 5xx остаётся нулевым. Разбор скрытой деградации PostgreSQL
2026-02-20 в 18:45, admin, рубрики: haproxy, latency, pgbouncer, postgresql, retry, sre, Tor, деградация, инцидент, отказоустойчивостьИногда инцидент начинается не с 5xx и не с красного графика
Он начинается с одной стойки
И с одного таймаута
09:12 - alert: db-replica-02 connection timeout
HAProxy зелёный
HTTP 5xx = 0.2%
p50 = 38–42ms
2 стойки
В каждом свой ToR
Primary и app в rack-1
Replica-01 в rack-1
Replica-02 в rack-2
Три кита масштабируемого IT-продукта: закон больших чисел, теория вероятностей и статистика
2026-02-02 в 8:05, admin, рубрики: latency, p-value, slo, timeweb_статьи, закон больших чисел, статистика, теория вероятностейПривет! В каждой компании есть люди, которые не пишут код каждый день, но почти каждый день принимают решения, от которых этот код либо спокойно живёт под нагрузкой, либо превращается в источник инцидентов и срочных созвонов. Думаю они согласятся, что масштабируемые IT-продукты строятся не только на технологиях, а ещё и на умении мыслить вероятностно.
Когда в команде спорят о фичах, производительности или надёжности, я редко слышу принципиально разные аргументы. Чаще это разные формы одного и того же:
-Мне кажется, пользователям понравится.
-Я уверен, что система выдержит.
-Читать полностью »
BBRv3, FEC и QUIC: как мы удержали jitter <1 мс и стабилизировали RU<->EU
2025-11-09 в 13:15, admin, рубрики: bbrv3, HTTP3, latency, masque, QUIC, rfc, Алгоритмы, оптимизация, сетевые_технологииМы стабилизировали QUIC на реальных RU↔EU трассах: jitter <1 мс PoP↔PoP, P50 ~20–21 мс RU↔EU (end-to-end). Помогли BBRv3 с динамическим pacing, HTTP/3 Datagrams/MASQUE (RFC 9297/9298/9484) и экспериментальный FEC. На профиле 5% потерь при включенном FEC видим ~+10% goodput (recovery валидируем group-aligned тестом). Ниже - методика, цифры и репликация. Замеры - для наших RU↔EU путей (октябрь 2025), на других трассах цифры могут отличаться. Все тесты проводились на реальных Edge PoP узлах CloudBridge (Moscow, Frankfurt, Amsterdam) с использованием собственного инструмента quic-test.
1. Введение
Маршрутизация LLM: оптимизация путей обработки языка
2025-11-06 в 11:30, admin, рубрики: AI, artificial intelligence, data augmentation, latency, llm, llm-модели, MTBench, маршрутизация запросовПовышение эффективности и производительности через инновационные стратегии маршрутизации.
Что такое LLM Routing?
-
В стремительно развивающемся мире искусственного интеллекта большие языковые модели (LLM)Читать полностью »
Конвейеризация: универсальный способ повышения пропускной способности
2024-12-02 в 19:15, admin, рубрики: golang, latency, pipeline, throughput, архитектура приложений, архитектура процессоров, архитектура систем, конвейер, микросервисы, пропускная способность
Что общего между стиральной машиной, CPU и микросервисами? Все они выигрывают от «конвейеризации» (англ. pipelining).

