Рубрика «BigData»

Топ-10 требований к ИТ-системе бюджетирования

2026-04-27 в 8:15, admin, рубрики: BigData, etl, Excel, бюджетирование, ит-системы, совместная работа, требования к системе, финансовый план

В условиях глобальной неопределенности финансовое планирование и бюджетирование перестает быть ритуалом подготовки отчетов – сегодня это живой процесс, который определяет жизнеспособность компании, развивая базовые подходы в комплексную систему интегрированного планирования.

Бюджетирование – очень важная, интересная и нетривиальная задача, которую в современном мире принято решать при помощи автоматизации. Если еще 5 лет назад в системе бюджетирования видели инструмент консолидации и план-факт анализа, то сегодня это комплексная высокотехнологична модель бизнеса.

Читать полностью »

Решение обратной задачи рекомендаций: опыт участия в VK RecSys Challenge

2026-01-19 в 5:15, admin, рубрики: BigData, huggingface, ml, recsys, recsys challenge 2025, vk-lsvd, Большие данные, коллаборативная фильтрация, рекомендации контента

Введение

В декабре 2025 года VK провёл RecSys Challenge LSVD — соревнование по машинному обучению с нестандартной постановкой задачи. Традиционные рекомендательные системы решают проблему "что показать пользователю", но здесь требовалось обратное: для каждого нового клипа определить, каким пользователям он может быть интересен. Такой подход помогает решать проблему холодного старта контента, когда новое видео только появляется в системе и не имеет истории взаимодействий.

Я принял участие в этом челлендже и хочу поделиться своим решением, архитектурой системы и практическими выводами.

Постановка задачи и данные

Читать полностью »

Анализ данных с сайта Pet911

2025-12-13 в 19:54, admin, рубрики: analysis, BigData, python, животные, питомцы, пропажа

Читать полностью »

Когда база устала искать: архитектура OpenSearch для больших данных

2025-10-29 в 6:16, admin, рубрики: acid, BigData, CDC, opensearch, pgvector, postgis, postgresql, архитектура, индексация, поиск

Вам куда? История Uber

2025-10-19 в 5:58, admin, рубрики: BigData, uber, автономия, Алгоритмы, беспилотный автомобиль, Большие данные, доставка еды, такси, шеринг-экономика, экосистема

Нажми кнопку — и поезжай. Эта идея стала началом того, что впоследствии изменило облик городского транспорта, бросило вызов регуляторам по всему миру и превратило Uber в глагол, узнаваемый по всему земному шару.

Сегодня экосистема Uber перевозит не только людей, но и еду, продукты и товары, объединяя миллионы партнёров-водителей и сотни миллионов клиентов — в десятках миллиардов поездок.

От дерзкого нарушителя правил до интегрированного партнёра — таков путь Uber.

Такси до Uber

Читать полностью »

PostgreSQL против 10 миллионов записей: оптимизация запросов, которая спасла наш проект

2025-10-03 в 14:16, admin, рубрики: BigData, explain analyze, postgresql, sql, базы данных, Большие данные, индексирование, индексы, оптимизация запросов, производительность

PostgreSQL против 10 миллионов записей: оптимизация запросов, которая спасла наш проект

Пролог: Когда база данных говорит «нет»

Это был обычный понедельник. Я пил кофе, проверял почту, и вдруг — волна уведомлений в Slack. «Сайт не грузится!», «Отчеты зависли!», «Что происходит?».

Читать полностью »

От Excel до ИИ: зачем бизнесу переходить на Smart Analytics

2025-09-05 в 12:01, admin, рубрики: BigData, teamly, аналитика данных, база знаний, умный поиск

Вы когда-нибудь открывали папку «Архив_2017», чтобы среди файлов вроде «отчет_финал_второй_финал.xls» найти нечто, от чего зависит судьба проекта? А бывало в вашей компании такое, когда директора спорили на совещаниях: «Интуиция подсказывает — этот клиент уйдёт» — «А у нас цифры говорят, что останется»?

Читать полностью »

WAP паттерн в data-engineering

2025-08-16 в 6:15, admin, рубрики: big data, BigData, data engineering, data quality, data warehouse, DataLake, etl, warehouse

В русскоязычной части интернета присутствует много статей по теме паттернов разработки, однако я не нашел никакой информации о паттернах работы с данными.

В данной статье я хочу рассказать о паттерне Write-Audit-Publish, о предпосылках его появления, а также наглядно рассмотреть как он работает.

История зарождения

С момента появления концепции data lake, компании старались собирать как можно данных, иногда не слишком задумываясь об их качестве. Появилось четкое понимание, что данные "когда-нибудь" могут быть использованы. Так, согласно исследованиям market.us Читать полностью »

AutismSmartDetector: Система для определения черт аутистического спектра

2025-08-05 в 16:06, admin, рубрики: BigData, computer vision, data science, python, pytorch, медицина, медицина будущего, педагогика, психиатрия, психология

Оригинал материала

Читать полностью »

Вселенная на ладони: крупнейший релиз данных JWST открывает космос для всех

2025-06-18 в 13:15, admin, рубрики: BigData, COSMOS-Web, астрономия, Вселенная, космос, Научно-популярное

В июне 2025 года астрономы всего мира получили доступ к огромному массиву данных от телескопа Джеймс Уэбб (JWST). Проект COSMOS-Web, поддерживаемый NASA, выложил в открытый доступ 1,5 терабайта информации со снимками, фотометрическими каталогами и интерактивными инструментами для изучения глубокого космоса. Open-source-модель исследований, которая лежит в основе проекта, обещает «сделать звезды ближе» для всех нас. Разберемся, что это за данные, почему они важны и как меняют подход к науке.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «BigData»

Топ-10 требований к ИТ-системе бюджетирования

Решение обратной задачи рекомендаций: опыт участия в VK RecSys Challenge

Введение

Постановка задачи и данные

Анализ данных с сайта Pet911

Когда база устала искать: архитектура OpenSearch для больших данных

Оглавление

Вам куда? История Uber

Такси до Uber

PostgreSQL против 10 миллионов записей: оптимизация запросов, которая спасла наш проект

PostgreSQL против 10 миллионов записей: оптимизация запросов, которая спасла наш проект

Пролог: Когда база данных говорит «нет»

От Excel до ИИ: зачем бизнесу переходить на Smart Analytics

WAP паттерн в data-engineering

История зарождения

AutismSmartDetector: Система для определения черт аутистического спектра

Вселенная на ладони: крупнейший релиз данных JWST открывает космос для всех