Рубрика «data science» - 4

Инструкция по бесплатной GPT генерации новых фичей для наращивания точности ML модели

2025-10-20 в 17:25, admin, рубрики: auc, data mining, data science, gpt, machine learning, OpenAI, python, машинное обучение, нейронные сети, скоринг

Читать полностью »

Разработка MCP-сервера на примере CRUD операций

2025-10-18 в 16:41, admin, рубрики: agents, data science, llm, MCP, nlp, python, tools

Model Context Protocol (MCP) — это открытый протокол, разработанный компанией Anthropic. Он призван унифицировать способ взаимодействия между LLM и сторонними сервисами, инструментами и источниками данных.

До появления MCP каждому разработчику приходилось пилить свой велосипед для каждого сервиса. При этом один API требовал одного формата, другой — совершенно другого. А в случае изменений сервиса приходилось менять и клиентскую сторону. В общем проблем было много. MCP же оставил большинство этих проблем позади.

В данной статье на примере простых CRUD-операций разберем, что такое MCP-сервер, как его создать и как подружить с LLM.

Читать полностью »

HumanDynamics: как мы построили цифровой мир, жители которого пошли в банк и взяли кредит

2025-10-16 в 9:34, admin, рубрики: ai-модель, data science, HumanDynamics, llm-агент, llm-модели, Neoflex

— Нам нужны люди.
— Какие?
— Которых не существует. Но которые живут.
— ?!

Статья Елизаветы Курочкиной, старшего специалиста по Data Science, компании Neoflex, посвящена рассказу о том, как простая задача генерации синтетических данных для банка переросла в создание фреймворка симуляции цифровой цивилизации под названием HumanDynamics.

Зачем вообще понадобилось что-то симулировать?

Одна из ключевых проблем, с которой сталкивается банковская сфера, — данныеЧитать полностью »

Топ вопросов с Data Science собеседований: Деревья и ансамбли, кластеризация, метрические модели

2025-10-11 в 18:11, admin, рубрики: data science, data scientist, DS, machinelearning, ml, ml engineer, ансамбли, деревья решений, кластеризация, собеседование

Знание классики - база любых собеседований на все грейды в DS!

Этот материал не рассчитан на изучение тем с нуля. Это чеклист и тренажёр, по которому стоит пройтись перед техническим интервью по классическому ML. Кратко, по делу, с акцентом на то, что действительно спрашивают.

Это вторая часть вопросов по classic ML, если вы не видели первую, то обязательно читайте (там разобрал основы мл, линейные модели, метрики классификации и регресии).

А в этой части разберем:

деревья
ансамбли
метрические модели
кластеризацию

Читать полностью »

Бесконечность в ваших данных – power laws

2025-10-05 в 21:17, admin, рубрики: data science, анализ данных, аналитика данных, наука о данных, статистика

Сегодня я хочу рассказать о теме, которая редко затрагивается в курсах по статистике, но порой встречается на практике. Она может сломать основания всех ваших привычных методов и даже ваш мозг. Имя этой теме – power laws или “степенные законы”. В этой статье я расскажу, что это такое, покажу примеры реальных данных и расскажу, что делать, если в ваших данных встретился степенной закон. Я постарался сделать текст читаемым для широкого круга людей и не нагружать его формулами.

Читать полностью »

Как написать нейросеть для бизнеса на Python

2025-10-03 в 12:49, admin, рубрики: data science, python, нейронна, нейронная сеть с нуля, нейросети p, нейросеть

Привет! Сегодня мы разберем, как нейросети автоматизируют рутинные безнес-процессы на реальном примере — классификации заявок в службу поддержки. Даже простые нейросети способны значительно разгрузить сотрудников и ускорить обработку данных.

Читать полностью »

ИИ в 3 фазы… снижение рисков, экономия времени и помощь человеку. Но …— нужно дать пользу уже на первом шаге

2025-09-16 в 13:51, admin, рубрики: autoencoder, cnn, CV, data science, deeplearning, Внедрение, искусственный интеллект, разработка

«В крупных компаниях ИИ не продается как технология. Он продается как снижение рисков, экономия времени и помощь человеку.
Но чтобы его купили — нужно дать пользу уже на первом шаге.
Вот как мы сделали это без бюджета, без команды и с одними только идеями»

1. Введение: Не про ИИ. Про то, как заставить бизнес поверить в изменения

Привет!

Меня зовут Алексей. Я руковожу направлением искусственного интеллекта в федеральном холдинге.
Моя задача — не «внедрить нейросеть», а сделать так, чтобы люди перестали бояться изменений.

Раньше сотрудникам требовалось 40–60 минут, чтобы создать документ выбраковки:
Читать полностью »

Как высчитать дно Биткоина. Разбираем индикатор Hash Ribbons: Математика и код

2025-09-12 в 13:47, admin, рубрики: bitcoin, data science, Hash Rate, On-chain analytics, pine script, tradingview, анализ данных, Криптовалюты, майнинг

На криптовалютном рынке цены очень хаотично движутся, прогнозы сбываются не каждый раз (особенно если вы полагаетесь на мнение инфлов), а новостной фон подливает масла в огонь. В этом хаосе многие пытаются найти хоть какие-то закономерности, опираясь не на догадки, а на измеримые данные.

Сегодня мы как раз и займемся таким анализом — разберем популярный в узких кругах индикатор Hash Ribbons. Но сделаем это не как трейдеры в поисках кнопки "бабло", а разберем, что там под условно капотом.

Важный дисклеймер:Читать полностью »

Путь от школьной математики к Data Science и системной инженерии: как я учился строить продукты

2025-08-29 в 7:17, admin, рубрики: AI, big data, data science, mlops, автоматизация, инженерия данных, машинное обучение, Системная инженерия

Историиуспеха часто подаются слишком гладко. Но за каждым «сегодня я работаю в Data Science» всегда стоит длинный и запутанный маршрут.

Я хочу поделиться своей дорогой — не как учебником, а как историей, которая, возможно, поможет тем, кто сейчас только ищет направление или сомневается, стоит ли идти в аналитику, инженерию или AI.

Начало: школьный выбор и первая любовь к системам

Моя отправная точка — школа. Учился я в физико‑математическом классе, где нас приучали к структурному мышлению и логике. Это был мой первый контакт с идеей, что за любым хаосом всегда можно найти систему.

Читать полностью »

Semantic Retrieval-Augmented Contrastive Learning (SRA-CL) для sequential рекомендательных систем: обзор

2025-08-18 в 15:38, admin, рубрики: data science, machine learning, recsys, Transformers

👋 Привет!

Меня зовут Никита Горячев, я Research Engineer в WB, последние несколько лет работаю на стыке RecSys, LLM и мультимодальных моделей. Каждый день мы обрабатываем миллиарды событий, а модели, которые мы внедряем, напрямую влияют на CTR, удержание и конверсию, принося немало дополнительной выручки.

До этого я успел поработать в AI-стартапе в Palo Alto, где занимался голосовыми агентами (ASR/TTS), и в МТС, где мы строили AI-экосистему. Ранее в Сбере я занимался созданием единого RecSys SDK для всей экосистемы (от SberMegaMarket до Okko и Zvuk), а ещё раньше — развивал персонализацию и ML в ритейле.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «data science» - 4

Инструкция по бесплатной GPT генерации новых фичей для наращивания точности ML модели

Разработка MCP-сервера на примере CRUD операций

HumanDynamics: как мы построили цифровой мир, жители которого пошли в банк и взяли кредит

Зачем вообще понадобилось что-то симулировать?

Топ вопросов с Data Science собеседований: Деревья и ансамбли, кластеризация, метрические модели

Бесконечность в ваших данных – power laws

Как написать нейросеть для бизнеса на Python

Читать полностью »

ИИ в 3 фазы… снижение рисков, экономия времени и помощь человеку. Но …— нужно дать пользу уже на первом шаге

1. Введение: Не про ИИ. Про то, как заставить бизнес поверить в изменения

Как высчитать дно Биткоина. Разбираем индикатор Hash Ribbons: Математика и код

Путь от школьной математики к Data Science и системной инженерии: как я учился строить продукты

Начало: школьный выбор и первая любовь к системам

Semantic Retrieval-Augmented Contrastive Learning (SRA-CL) для sequential рекомендательных систем: обзор