Прогноз ЧМ 2014 на языке Вольфрама

в 17:26, , рубрики: data mining, Wolfram Alpha, Поисковые машины и технологии, футбол, чемпионат мира, метки: , ,

Прогноз ЧМ 2014 на языке Вольфрама

На ЧМ по футболу закончилась групповая стадия, количество команд-участниц сократилось вдвое, стали известны пары участников плей-офф. В связи с этим, разработчики из компании Wolfram Research обновили расчёт статистической вероятности для оставшихся матчей.

Предварительно в Wolfram|Alpha загрузили около 200 МБ данных, извлечённых со специализированных сайтов. Это, прежде всего, исторические данные о 30 000 международных матчах с 1950 по 2014 годы, в том числе составы команд и характеристики игроков. Это не только для прогноза исхода матчей, а чтобы система Wolfram|Alpha могла обрабатывать поисковые запросы, связанные с футболом.

Например, вот статистика по изменению роста и индекса массы тела футболистов за последние 50 лет.

Прогноз ЧМ 2014 на языке Вольфрама

Прогноз ЧМ 2014 на языке Вольфрама

Возвращаясь к анализу ЧМ 2014, модель рассчитывает вероятность исхода каждого матча, основываясь на статистике прошлых игр, в том числе с учётом преимущества домашнего поля, преимущества своего континента и других факторов, которые выявились после анализа исторической базы. Модель затем прошла тренировку на 2000 последних матчах и показала точность прогноза 48%.

Прогноз ЧМ 2014 на языке Вольфрама

После добавления в модель Elo-рейтингов команд точность увеличилась 58,3%, а для матчей на выбывание — 75,7%. Это вполне достаточно, чтобы рассчитать вероятность исхода ЧМ 2014.

Итак, после групповой стадии вероятность победы в турнире распределяется следующим образом.

Прогноз ЧМ 2014 на языке Вольфрама

По сравнению с предыдущим прогнозом, резко выросли шансы Нидерландов (благодаря крупной победе над фаворитом).

Наиболее вероятная пара финалистов — Бразилия и Нидерланды.

Прогноз ЧМ 2014 на языке Вольфрама

Вся сетка предполагаемых исходов игр плей-офф показана на схеме.

Прогноз ЧМ 2014 на языке Вольфрама

Ещё один набор диаграмм показывает вероятность выигрыша (синим) или проигрыша (оранжевым) для 9 наиболее рейтинговых команд на каждой стадии плей-офф.

Прогноз ЧМ 2014 на языке Вольфрама

На групповой стадии ЧМ 2014 точность прогноза Wolfram|Alpha составила 62,5% (движок правильно рассчитал победу Коста-Рики над Италией, ничью в матче Германии и Ганы, ничью Бразилии и Мексики, а также несколько других неочевидных исходов). Посмотрим, как модель покажет себя в матчах плей-офф.

Автор: alizar

Источник

Поделиться

* - обязательные к заполнению поля