Рубрика «time series»

Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь

2026-04-13 в 12:45, admin, рубрики: algorithms, benchmark, Downsampling, filtering, scatterplot, Telemetry, time series

Вот что видит пользователь, когда мы рисуем график давления в скважине за два года — 50 миллионов точек:

Слева — идеальная отрисовка. Справа — LTTB. Потеряно 59.2% плотности.

Читать полностью »

RL-агент для алгоритмической торговли на Binance Futures: архитектура, бэктест, результаты

2025-08-05 в 14:15, admin, рубрики: Binance, cryptocurrency, deep learning, finance, investment, machine learning, python, quantitative finance, time series

Кривая баланса на бэктестеДинамика капитала на отложенных рыночных данных (период: 2025-03-01 — 2025-06-01), с учётом комиссий и проскальзываний. Итоговое изменение баланса: +144.23%

За гранью A-B: Синтетический контроль

2025-03-28 в 7:19, admin, рубрики: ab-тестирование, causal Inference, data analytics, data science, time series, аналитика данных, оценка эффекта, прогнозирование, продуктовая аналитика

Привет! Я Настя — лид A/B Платформы в Wildberries. На протяжении всего карьерного пути меня интересует тема оценки эффектов. Для этого существуют различные инструменты, в числе которых как A/B‑тестирование, так и альтернативные способы, например, различные вариации Causal Inference.

В этой статье я хочу поделиться примером проведения двух квази‑экспериментов в Wildberries с использованием Синтетического контроля (Synthetic Control).

Почему не А/B-тестирование?

Читать полностью »

Эконометрика в ритейле: как не потратить миллионы на заведомо неэффективные эксперименты

2025-01-16 в 13:08, admin, рубрики: data science, time series, АБ-тесты, анализ данных, аналитика, временные ряды, коинтеграция, статистика, эконометрика, эконометрика в ритейле

Всем привет! На связи команда ad-hoc аналитики X5 Tech. Если вы уже знакомы с нашими статьями, то наверняка знаете, что нашей ключевой темой является А/Б тестирование. Важной составляющей А/Б теста является дизайн: для успешного проведения эксперимента необходимо оценить размер тестовой и контрольной групп, зафиксировав предварительно ожидаемый эффект. Но возникает вопрос: как убедиться в обоснованности гипотезы и рассчитать ожидаемые эффекты от инициативы?

Читать полностью »

Chronos от Amazon: революция в обработке временных рядов. Часть 2

2024-12-06 в 6:00, admin, рубрики: artificial intelligence, Chronos, data science, llm, machine learning, natural language processing, time series, временные ряды, искусственный интеллект, машинное обучение

Итак, друзья, продолжаем тему прогнозирования временных рядов с помощью Chronos.

Напомню, что Chronos это фреймворк от компании Amazon — простой, но эффективный фрэймворк для предобученных вероятностных моделей временных рядов.

Читать полностью »

Всем про LLM. Как рассказать про трансформеры одинаково хорошо и индустриалам, и исследователям

2024-10-03 в 8:44, admin, рубрики: computational linguistics, distillation, image processing, llm, quantization, tabular data, time series, преподавание, трансформеры

Привет. Меня зовут Вика, я работаю в AIRI, преподаю в Школе Анализа Данных и Сколтехе и вместе со своими коллегами занимаюсь обработкой естественного языка, изображений и видео, а также иными задачами, где могли бы пригодиться трансформерные модели. Трансформерные архитектуры — очень мощное орудие, которые может быть применено почти во всех сферах DL, и интереснейший концепт, в котором много потенциала для исследования. А, главное, их очень легко применить к технологиям, которые способны изменить нашу жизнь здесь и сейчас.

Читать полностью »

Как Meta Learning помог выиграть хакатон

2022-09-17 в 13:48, admin, рубрики: big data, Kats, MetaLearning, ml, python, time series, искусственный интеллект, машинное обучение, хакатон

История о трех бессонных ночах ресерча и преисполнении в познании

В этой статье я расскажу о том, как мы поучаствовали в хакатоне “Цифровой прорыв” в северо-западном федеральном округе, и познакомлю вас с концепцией Meta Learning, которая позволила нам построить достойный алгоритм и победить!

Содержание:

Описание кейса
Что такое Meta Learning?
Наше решение
Напоследок

Читать полностью »

Time series данные в реляционной СУБД. Расширения TimescaleDB и PipelineDB для PostgreSQL

2019-08-28 в 10:23, admin, рубрики: PipelineDB, postgresql, time series, time series database, timescaledb, Администрирование баз данных, Блог компании Конференции Олега Бунина (Онтико), визуализация данных, временные ряды, хранение данных

Time series данные или временные ряды — это данные, которые изменяются во времени. Котировки валют, телеметрия перемещения транспорта, статистика обращения к серверу или нагрузки на CPU — это time series данные. Чтобы их хранить требуются специфичные инструменты — темпоральные базы данных. Инструментов — десятки, например, InfluxDB или ClickHouse. Но даже у самых лучших решений для хранения временных рядов есть недостатки. Все time series хранилища низкоуровневые, подходят только для time series данных, а обкатка и внедрение в текущий стек — дорого и больно.

Time series данные в реляционной СУБД. Расширения TimescaleDB и PipelineDB для PostgreSQL - 1

Но, если у вас стек PostgreSQL, то можете забыть о InfluxDB и всех остальных темпоральных БД. Ставите себе два расширения TimescaleDB и PipelineDB и храните, обрабатываете и проводите аналитику time series данных прямо в экосистеме PostgreSQL. Без внедрения сторонних решений, без недостатков темпоральных хранилищ и без проблем их обкатки. Что это за расширения, в чем их преимущества и возможности, расскажет Иван Муратов (binakot) — руководитель отдела разработки в «Первой Мониторинговой Компании».
Читать полностью »

Zabbix, временные ряды и TimescaleDB

2019-07-02 в 12:32, admin, рубрики: open source, postgresql, time series, time series database, tsdb, zabbix, zabbix 4.2, zabbix мониторинг, Администрирование баз данных, Блог компании Zabbix, системное администрирование

Каждая система мониторинга сталкивается с тремя видами проблем, связанных с производительностью.

Во-первых, хорошая система мониторинга должна очень быстро получать, обрабатывать и записывать поступающие извне данные. Счёт идёт на микросекунды. Навскидку это может показаться неочевидным, но когда система становится достаточно большой, все эти доли секунд суммируются, превращаясь в хорошо заметные задержки.

Читать полностью »

Нестандартная кластеризация, часть 3: приёмы и метрики для кластеризации временных рядов

2017-07-27 в 6:55, admin, рубрики: cluster, clustering, data mining, graphs, metrics, review, time series, математика, машинное обучение

Пока другие специалисты по машинному обучению и анализу данных выясняют, как прикрутить побольше слоёв к нейронной сети, чтобы она ещё лучше играла в Марио, давайте обратимся к чему-нибудь более приземлённому и применимому на практике.

Кластеризация временных рядов — неблагодарное дело. Даже при группировке статических данных часто получаются сомнительные результаты, что уж говорить про информацию, рассеянную во времени. Однако нельзя игнорировать задачу, только потому что она сложна. Попробуем разобраться, как выжать из рядов без меток немного смысла. В этой статье рассматриваются подтипы кластеризации временных рядов, общие приёмы и популярные меры расстояния между рядами. Статья рассчитана на читателя, уже имевшего дело с последовательностями в data science: о базовых вещах (тренд, ARMA/ARIMA, спектральный анализ) рассказываться не будет.

Нестандартная кластеризация, часть 3: приёмы и метрики для кластеризации временных рядов - 1

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «time series»

Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь

RL-агент для алгоритмической торговли на Binance Futures: архитектура, бэктест, результаты

За гранью A-B: Синтетический контроль

Почему не А/B-тестирование?

Эконометрика в ритейле: как не потратить миллионы на заведомо неэффективные эксперименты

Chronos от Amazon: революция в обработке временных рядов. Часть 2

Всем про LLM. Как рассказать про трансформеры одинаково хорошо и индустриалам, и исследователям

Как Meta Learning помог выиграть хакатон

Time series данные в реляционной СУБД. Расширения TimescaleDB и PipelineDB для PostgreSQL

Zabbix, временные ряды и TimescaleDB

Нестандартная кластеризация, часть 3: приёмы и метрики для кластеризации временных рядов