Рубрика «линейная регрессия»

Статистика под капотом LinearRegression: почему мы минимизируем именно квадрат ошибки?

2025-11-08 в 18:00, admin, рубрики: линейная регрессия, Максимальное правдоподобие, машинное обучение, статистика

Введение

Все ML-инженеры знают о линейной регрессии. Это та самая база, с которой начинает изучение алгоритмов любой новичок. Но вот парадокс: даже многие «прожженные» инженеры не всегда до конца понимают ее истинную работу под капотом.

А именно — какая у «линейки» статистическая связь с Методом Максимального Правдоподобия (MLE) и почему она так сильно «любит» MSE и нормальное распределение. В этой статье мы как раз в этом и разберемся.

Освежаем в памяти Линейную регрессию

Линейная регрессия это как “Hello world” в мире классического машинного обучения.
Читать полностью »

Фундаментальные вопросы по ML-DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация

2025-06-15 в 2:10, admin, рубрики: data science, machine learning, ml-интервью, naive bayes, python, scikit-learn, SVM, Алгоритмы, линейная регрессия, регуляризация

У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение.

Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять, но так же не лишая полноты!

Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу! Это самое важное, оно происходит в секции с кодом.

Будет здорово получить ваши задачи и в следующих выпусках разобрать!

Читать полностью »

Diff-in-diff: жизнь за пределами идеального эксперимента

2024-12-18 в 13:47, admin, рубрики: causal Inference, diff-in-diff, difference-in-difference, treatment, АБ-тесты, линейная регрессия, статистика, эконометрика, эксперимент

Привет! На связи команда ad-hoc аналитики X5 Tech.

Основная задача аналитика при проведении А/Б тестирования - оценка эффекта воздействия (тритмента). Примеров задач по оценке эффекта воздействия множество:

Как изменится выручка от продаж, если изменить ассортимент товаров, предлагаемых в пространстве около кассы?
Удастся ли улучшить самочувствие пациентов, если они начнут принимать новый препарат?
Что произойдёт с оценками школьников, если они начнут посещать репетиторов?

Читать полностью »

Машинное обучение: Линейная регрессия. Теория и реализация. С нуля. На чистом Python

2024-12-03 в 15:00, admin, рубрики: искусственный интеллект, линейная регрессия, машинное обучение

В этой статье я рассказываю про линейную регрессию, свойства, которыми должны обладать данные для модели, процесс обучения, регуляризацию, метрики качества. Кроме чистой теории я показываю как это все реализовать. Я рассказываю все в своем стиле и понимании - с инженерной точки зрения, с точки зрения того, как реализовывать с нуля.

Введение

Линейная регрессия (ЛинР)Читать полностью »

Предсказываем стоимость логистики грузоперевозок по городам на данных маркетплейсов логистики

2024-11-24 в 4:32, admin, рубрики: линейная регрессия

Перевозка грузов является одной из важных сфер бизнеса, особенно в странах, имеющих большое транзитное значение, таких как Казахстан. При этом тарифы на перевозку, хоть и играют решающую роль при оценке доходности логистического бизнеса, весьма непрозрачны и зависят от большого количества факторов. В этих условиях кажется логичным построение модели, позволяющей с хорошим приближением предсказывать стоимость перевозки груза в зависимости от его параметров, условий перевозки, а также начального и конечного пунктов. В данном посте будут описаны основные этапы построения такой модели.

Этапы построения модели

Читать полностью »

Как пакет с пакетами помог аналитику решить задачу для бизнеса, или keep calm and import statsmodels

2024-10-17 в 9:00, admin, рубрики: data science, linear regression, python, statsmodels, линейная регрессия

Всем привет!
Читать полностью »

50 оттенков линейной регрессии, или почему всё, что вы знаете об A-B тестах, помещается в одно уравнение

2024-09-27 в 7:42, admin, рубрики: cuped, линейная регрессия, Статистика в IT

Всем привет! A/B тестирование уже давно стало стандартом в проверке гипотез и улучшении продуктов в X5. Но, как ни странно, многие из «модных» техник, которые применяются в A/B тестировании, на самом деле, не что иное, как вариации старой доброй линейной регрессии.

Например, использование таких методов, как t-тест, стратификация, CUPED, CUMPED, по сути, сводятся к построению линейной регрессии и проверке гипотезы в рамках построенной модели. Наши коллеги из команды ad-hoc аналитики Х5 Tech уже писали про стратификацию здесь и про CUPED здесь Читать полностью »

Учим нейросети в Google Таблицах

2020-04-29 в 11:58, admin, рубрики: Excel, Google Sheets, machine learning, Блог компании Юла, линейная регрессия, машинное обучение, нейросети, ненормальное программирование

Хочу с вами зачелленджить одну интересную штуку: попробовать обучить нейросеть в Google Таблицах. Безо всяких макросов и прочих хаков, на чистых формулах.

Учим нейросети в Google Таблицах - 1

Читать полностью »

Прогнозирование продаж недвижимости. Лекция в Яндексе

2018-08-19 в 13:07, admin, рубрики: catboost, scikit-learn, xgboost, Блог компании Яндекс, линейная регрессия, машинное обучение, Спортивное программирование

Успех в проектах по машинному обучению обычно связан не только с умением применять разные библиотеки, но и с пониманием той области, откуда взяты данные. Отличной иллюстрацией этого тезиса стало решение, предложенное командой Алексея Каюченко, Сергея Белова, Александра Дроботова и Алексея Смирнова в конкурсе PIK Digital Day. Они заняли второе место, а спустя пару недель рассказали о своём участии и построенных моделях на очередной ML-тренировке Яндекса.

Алексей Каюченко:
— Добрый день! Мы расскажем о соревновании PIK Digital Day, в котором мы участвовали. Немного о команде. Нас было четыре человека. Все с абсолютно разным бэкграундом, из разных областей. На самом деле, мы на финале познакомились. Команда сформировалась буквально за день до финала. Я расскажу про ход конкурса, организацию работы. Потом выйдет Сережа, он расскажет про данные, а Саша расскажет уже про сабмишен, про финальный ход работы и про то, как мы двигались по лидерборду.

Читать полностью »

Метод Уэлфорда и многомерная линейная регрессия

2017-12-04 в 3:57, admin, рубрики: Алгоритмы, вычислительная математика, линейная регрессия, математика, машинное обучение, метод Уэдфорда, Программирование, численные методы

Многомерная линейная регрессия — один из основополагающих методов машинного обучения. Несмотря на то, что современный мир интеллектуального анализа данных захвачен нейронными сетями и градиентным бустингом, линейные модели до сих пор занимают в нём своё почётное место.

В предыдущих публикациях на эту тему мы познакомились с тем, как получать точные оценки средних и ковариаций методом Уэлфорда, а затем научились применять эти оценки для решения задачи одномерной линейной регрессии. Конечно, эти же методы можно использовать и в задаче многомерной линейной регрессии.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «линейная регрессия»

Статистика под капотом LinearRegression: почему мы минимизируем именно квадрат ошибки?

Введение

Освежаем в памяти Линейную регрессию

Фундаментальные вопросы по ML-DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация

Diff-in-diff: жизнь за пределами идеального эксперимента

Машинное обучение: Линейная регрессия. Теория и реализация. С нуля. На чистом Python

Введение

Предсказываем стоимость логистики грузоперевозок по городам на данных маркетплейсов логистики

Этапы построения модели

Читать полностью »

Как пакет с пакетами помог аналитику решить задачу для бизнеса, или keep calm and import statsmodels

50 оттенков линейной регрессии, или почему всё, что вы знаете об A-B тестах, помещается в одно уравнение

Учим нейросети в Google Таблицах

Прогнозирование продаж недвижимости. Лекция в Яндексе

Метод Уэлфорда и многомерная линейная регрессия