- PVSM.RU - https://www.pvsm.ru -
На ЧМ по футболу закончилась групповая стадия, количество команд-участниц сократилось вдвое, стали известны пары участников плей-офф. В связи с этим, разработчики из компании Wolfram Research обновили расчёт статистической вероятности [1] для оставшихся матчей.
Предварительно в Wolfram|Alpha загрузили около 200 МБ данных, извлечённых со специализированных сайтов. Это, прежде всего, исторические данные о 30 000 международных матчах с 1950 по 2014 годы, в том числе составы команд и характеристики игроков. Это не только для прогноза исхода матчей, а чтобы система Wolfram|Alpha могла обрабатывать поисковые запросы, связанные с футболом.
Например, вот статистика по изменению роста и индекса массы тела футболистов за последние 50 лет.
Возвращаясь к анализу ЧМ 2014, модель рассчитывает вероятность исхода каждого матча, основываясь на статистике прошлых игр, в том числе с учётом преимущества домашнего поля, преимущества своего континента и других факторов, которые выявились после анализа исторической базы. Модель затем прошла тренировку на 2000 последних матчах и показала точность прогноза 48%.
После добавления в модель Elo-рейтингов [2] команд точность увеличилась 58,3%, а для матчей на выбывание — 75,7%. Это вполне достаточно, чтобы рассчитать вероятность исхода ЧМ 2014.
Итак, после групповой стадии вероятность победы в турнире распределяется следующим образом.
По сравнению с предыдущим прогнозом, резко выросли шансы Нидерландов (благодаря крупной победе над фаворитом).
Наиболее вероятная пара финалистов — Бразилия и Нидерланды.
Вся сетка предполагаемых исходов игр плей-офф показана на схеме.
Ещё один набор диаграмм показывает вероятность выигрыша (синим) или проигрыша (оранжевым) для 9 наиболее рейтинговых команд на каждой стадии плей-офф.
На групповой стадии ЧМ 2014 точность прогноза Wolfram|Alpha составила 62,5% (движок правильно рассчитал победу Коста-Рики над Италией, ничью в матче Германии и Ганы, ничью Бразилии и Мексики, а также несколько других неочевидных исходов). Посмотрим, как модель покажет себя в матчах плей-офф.
Автор: alizar
Источник [3]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/data-mining/63612
Ссылки в тексте:
[1] расчёт статистической вероятности: http://blog.wolfram.com/2014/06/26/world-cup-follow-up-update-of-winning-probabilities-and-betting-results/
[2] Elo-рейтингов: http://en.wikipedia.org/wiki/World_Football_Elo_Ratings
[3] Источник: http://habrahabr.ru/post/227925/
Нажмите здесь для печати.