Рубрика «Байес»

Почему современная наука основана на вере?

2021-07-04 в 12:58, admin, рубрики: Байес, дедукция, демаркация, индукция, Карл Поппер, наука, Научно-популярное, позитивизм, фейки, физика, Читальный зал

Галилео Галилей показывает кардиналам Луну

Научный метод, каким мы его знаем, формировался на протяжении тысяч лет в ходе преодоления череды философских кризисов. В этом посте я хочу рассказать про две величайшие проблемы в философии науки и вызовы, стоящие перед ней в настоящем.

Проблема неполной индукции

Знаменитый древнегреческий философ Аристотель Читать полностью »

Можно ли считать статистику при малом количестве данных?

2019-01-23 в 7:11, admin, рубрики: Байес, Занимательные задачки, малые выборки, математика, статистика, Статистика в IT

В целом ответ – да. Особенно, когда есть мозги и знание теоремы Байеса.
Напомню, что среднее и дисперсию можно считать только, если у вас имеется определенное количества событий. В старых методичках СССР РТМ (руководящий технический материал) говорилось, что чтобы считать среднее и дисперсию необходимо 29 измерений. Сейчас в ВУЗах немного округлили и используют число 30 измерений. С чем это связано – вопрос философский. Почему я не могу просто взять и посчитать среднее, если у меня есть 5 измерений? По идее ничто не мешает, только среднее получается нестабильным. После еще одного измерения и пересчета оно может сильно измениться и полагаться на него можно начиная где-то с 30 измерений. Но и после 31го измерения оно тоже пошатнется, только уже не так заметно. Плюс добавляется проблема, что и среднее можно считать поразомну и получать разные значения. То есть из большой выборки можно выбрать первые 30 и посчитать среднее, потом выбрать другие 30 и тд … и получить много средних, которые тоже можно усреднять. Истинное среднее бывает недостижимо на практике, так как всегда имеем конечное количество измерений. В таком случае среднее является статистической величиной со своим средним и дисперсией. То есть измеряя среднее на практике мы имеем в виду «предположительное среднее», которое может быть близко к идеальному теоретическом значению.

Попробуем разобраться в вопросе, на входе мы имеем некоторое количество фактов и хотим на выходе построить представление об источнике этих фактов. Будем строить мат модель и использовать теорию Байеса для связки модели и фактов.
Можно ли считать статистику при малом количестве данных? - 1
Читать полностью »

Открытый вебинар «Наивный байесовский классификатор»

2018-08-20 в 15:10, admin, рубрики: big data, data mining, data science, Байес, Блог компании Отус, классификация, машинное обучение

Всем привет!

В рамках нашего курса Data Scientist мы провели открытый урок на тему «Наивный баейсовский классификатор». Занятие вёл преподаватель курса Максим Кретов — ведущий исследователь в лаборатории нейронных сетей и глубокого обучения (МФТИ). Предлагаем ознакомиться с видео и кратким изложением.

Заранее спасибо.

Читать полностью »

Теорема Байеса: из-за чего весь сыр-бор?

2017-06-16 в 11:00, admin, рубрики: Байес, Научно-популярное, теорема Байеса, теория вероятностей, шелдон купер

Теорему Байеса называют мощным методом создания нового знания, но её можно использовать и для рекламы суеверий и псевдонауки

Теорема Байеса: из-за чего весь сыр-бор? - 1

Теорема Байеса стала такой популярной, что её даже показали в телешоу «Теория Большого взрыва». Но, как и любой инструмент, её можно использовать во благо или во вред.

Не знаю точно, когда впервые я услышал про неё. Но по-настоящему я начал проявлять интерес к ней только в последние лет десять, после того, как несколько самых больших ботанов из моих студентов начали рекламировать её как волшебного проводника в жизни.

Разглагольствования студентов запутали меня, как и объяснения теоремы на Википедии и других сайтах – они были либо совсем тупые, либо слишком сложные. Я решил, что Байес – преходящая причуда, и в глубоких исследованиях смысла нет. Но теперь байесовская лихорадка стала слишком назойливой, чтобы её игнорировать.
Читать полностью »

О линейной регрессии: байесовский подход к курсу рубля

2017-04-05 в 7:32, admin, рубрики: bayesian, data mining, jags, R, rjags, variable selection, анализ данных, Байес, временные ряды, всемирный заговор, курс, математика, машинное обучение, нефть, Программирование, регрессия, рубль, статистика, цены, эконометрика, метки: Временные ряды

О линейной регрессии: байесовский подход к курсу рубля - 1
Не секрет, что курс рубля напрямую зависит от стоимости нефти (и от кое-чего еще). Этот факт позволяет строить довольно интересные модели. В своей статье о линейной регрессии я коснулся некоторых вопросов, посвященных диагностике модели, а за кадром остался такой вопрос: есть ли более эффективная, но не слишком сложная альтернатива линейной регрессии? Традиционно используемый метод наименьших квадратов прост и понятен, но есть и другие подходы ~~(не такие понятные)~~.

Читать полностью »

MCMC-сэмплинг для тех, кто учился, но ничего не понял

2016-03-18 в 12:48, admin, рубрики: MCMC, MCMC-сэмплинг, Алгоритмы, Байес, Блог компании Wunder Fund, Программирование

Рассказывая о вероятностном программировании и Байесовской статистике, я обычно не уделяю особого внимания тому, как, на самом деле, выполняется вероятностный вывод, рассматривая его как некий «чёрный ящик». Вся прелесть вероятностного программирования заключается в том, что, на самом деле, для того, чтобы строить модели, не обязательно понимать, как именно делается вывод. Но это знание, безусловно, весьма полезно.

MCMC-сэмплинг для тех, кто учился, но ничего не понял - 1

Как-то раз я рассказывал о новой Байесовской модели человеку, который не особенно разбирался в предмете, но очень хотел всё понять. Он-то и спросил меня о том, чего я обычно не касаюсь. «Томас, — сказал он, — а как, на самом деле, выполняется вероятностный вывод? Как получаются эти таинственные сэмплы из апостериорной вероятности?».
Читать полностью »

О формуле Байеса, прогнозах и доверительных интервалах

2014-08-10 в 0:13, admin, рубрики: Алгоритмы, Байес, байесовский подход, математика, теория вероятностей, теория вероятности, тервер

На Хабре много статей по этой теме, но они не рассматривают практических задач. Я попытаюсь исправить это досадное недоразумение. Формула Байеса применяется для фильтрации спама, в рекомендательных сервисах и в рейтингах. Без нее значительное число алгоритмов нечеткого поиска было бы невозможно. Кроме того, это формула явилась причиной холивара среди математиков.

Читать полностью »

Фильтрация смс спама с помощью наивного байесовского классификатора (код на R)

2013-06-25 в 13:39, admin, рубрики: data mining, алгоритм, Алгоритмы, Байес, вероятность, искусственный интеллект, спам, метки: алгоритм, Байес, вероятность, спам

Фильтрация смс спама с помощью наивного байесовского классификатора (код на R) Привет. В этом посте мы рассмотрим простую модель фильтрации спама с помощью наивного байесовского классификатора с размытием по Лапласу, напишем несколько строк кода на R, и, наконец, протестируем на англоязычной базе данных смс спама. Вообще, на хабре я нашел две статьи посвященные данной теме, но ни в одной не было наглядного примера, чтобы можно было скачать код и посмотреть результат. Также не было упоминания про размытие, что существенно увеличивает качество модели, без особых затрат усилий, в отличие, скажем, от сложной предобработки текста. Но вообще, запилить очередной пост про наивного байеса меня побудило то, что я пишу методичку для студентов с примерами кода на R, вот и решил поделиться инфой.

Читать полностью »

Байесовский анализ в Python

2013-02-26 в 9:29, admin, рубрики: python, Алгоритмы, анализ данных, Байес, байесовский подход, искусственный интеллект, математика, метки: python, анализ данных, Байес, байесовский подход

Этот пост является логическим продолжением моего первого поста о Байесовских методах, который можно найти тут.
Я бы хотел подробно рассказать о том, как проводить анализ на практике.
Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «Байес»

Почему современная наука основана на вере?

Проблема неполной индукции

Можно ли считать статистику при малом количестве данных?

Открытый вебинар «Наивный байесовский классификатор»

Теорема Байеса: из-за чего весь сыр-бор?

Теорему Байеса называют мощным методом создания нового знания, но её можно использовать и для рекламы суеверий и псевдонауки

О линейной регрессии: байесовский подход к курсу рубля

MCMC-сэмплинг для тех, кто учился, но ничего не понял

О формуле Байеса, прогнозах и доверительных интервалах

Фильтрация смс спама с помощью наивного байесовского классификатора (код на R)

Байесовский анализ в Python

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «Байес»

Проблема неполной индукции

Теорему Байеса называют мощным методом создания нового знания, но её можно использовать и для рекламы суеверий и псевдонауки

Новости

Актуальные темы

Архив