Метка «прогнозирование»

image

Благодаря стремительному развитию информационных технологий, появилась возможность за считанные секунды проводить анализ большого объёма информации, строить сложные математические модели, решать задачи многокритериальной оптимизации. Учёные, занимающиеся вопросами циклического развития экономики, стали разрабатывать теории, полагая, что отслеживание тенденций ряда экономических переменных позволит прояснить и предсказать периоды подъёма и спада. Одним из объектов для изучения был выбран фондовый рынок. Предпринимались многократные попытки построить такую математическую модель, которая успешно бы решала задачу прогнозирования приращения цены акций. В частности, широкое распространение получил «технический анализ».
Читать полностью »

IBM опубликовала восьмой ежегодный прогноз «IBM 5 in 5» (#ibm5in5), посвященный пяти инновациям, способным в ближайшие пять лет повлиять на нашу жизнь, работу и стиль общения.

Пять инноваций, которые изменят нашу жизнь в следующие пять лет
Читать полностью »


Читать полностью »

IBM Watson? IBM Content Analytics!

Проанализировав большой объем доступной в интернете информации о некоторых людях, «младший брат» суперкомпьютера IBM Watson (работающий на подобных технологиях) под названием IBM Content Analytics with Enterprise Search наглядно показал нам, кто кому приходится братом, сестрой, мужем, должен денег, является личным адвокатом, подал в суд по определенному поводу и т.д. В нашем случае мы дополнительно узнали, что некоторые искомые пользователи обладают довольно-таки дорогой недвижимостью за 80 миллионов евро.

При этом мы сами не занимались сбором и анализом данным. Мы всего лишь сравнили результаты с действительностью — все оказалось правдой. Хочется еще раз подчеркнуть – вся информация была в открытом доступе. К сожалению, я не могу рассказать более подробно именно об этом проекте (возможно, вы обратили внимание на затертые имена). Данный пример показался мне наиболее интересным, поэтому я начал именно с него :)

В этой статье я хотел бы рассказать о базовых возможностях IBM Content Analytics with Enterprise Search. Если эта статья покажется интересной, то я напишу подробнее о том, как это работает.
Читать полностью »

При разработке/создании web-сайта, мобильного приложения, WEB-сервиса – иными словами Информационной системы (ИС) встает вопрос о требующих аппаратных ресурсах – количестве серверов (виртуальных машин).
Методология расчета нагрузки, количества пользователей информационной системы — web сайта или сервиса
Приведённая методика описывает расчет количества пользователей и «оборудования» для территории Российская федерация.

Исходные данные

  • Веб сайт «Визитка»;
  • WEB-сервис для мобильных приложений, работающий по протоколу http/https, взаимодействующий с Базой данных;
  • База данных SQL (NOSQL);
  • WEB-клиент – реализующий функционал мобильного приложения для web пользователей, также взаимодействующий с Базой данных.

Читать полностью »

Информация о пробках появилась на Яндексе в 2006 году. Начинали мы с необходимого — научились строить схему загруженности городских улиц и учитывать текущую ситуацию при прокладывании маршрутов. Автомобилисты, ориентируясь перед выездом на эту информацию, уже могли сэкономить время в пути:
image

Затем, чтобы помогать водителям непосредственно во время движения, мы добавили в мобильные Яндекс.Карты (и, как следствие, в Яндекс.Навигатор) автоматическое перестроение маршрута. Приложения научились адаптировать маршрут при каждом заметном изменении ситуации в городе.

Собрав на десктопе и в мобильном информацию про «сейчас», мы перешли к решению вопроса «а как будет потом?»:
image

Первым шагом стала статистическая карта пробок — на ней можно посмотреть, как в среднем стоит и едет город в конкретный час конкретного дня недели. Мы предполагали, что у карты «обычных» пробок может быть полезный побочный эффект — возможность по ним спрогнозировать заторы на ближайшее время. Но практика показала, что усреднённая картина помогает примерно спланировать только, например, завтрашнюю поездку в аэропорт — но не помогает выезжающим сейчас избежать новых пробок. По нашим измерениям, даже в конце часового маршрута картина пробок на момент выезда обычно ближе к фактической, чем усреднение:

image

Неделю назад на Яндекс.Картах появилась возможность посмотреть изменения пробок в ближайший час — следующий наш шаг в решении вопроса про будущее. Для тех, кто в этом году не смог приехать на Yet another Conference, мы сегодня расскажем, что у нашего прогноза внутри, и как оно там оказалось.
Читать полностью »

Бинаризация как более адекватная техника прогнозирования сводных значенийСего дня мы продолжим рассмотрение техник научного менеджмента в применении к управлению проектами. В частности, данная заметка будет продолжением моего описания алгоритма построения графика распределения вероятности для объектов воздействия рисков. Для этого мы рассмотрим, что такое процесс бинаризации, как его применить для более адекватной оценки прогнозных сводных значений, а также посмотрим на реализацию данного алгоритма на прекраснейшем языке программирования Haskell.

Хотелось бы сразу предупредить, что в статье есть немного «матана», так что для её чтения желательно иметь базовые представления о теории вероятности. В частности, необходимо понимание формул для умножения и сложения вероятностей для независимых событий. Более серьёзные темы из теории вероятностей здесь не рассматриваются.

Читать полностью »

Уже много лет учёные экспериментируют с алгоритмами, способными предсказывать преступность. Предполагается, что преступники склонны повторять успешные действия — по крайней мере, они не используют ГСЧ для выбора места и времени преступлений, так что их действия предсказуемы по определению.

Например, год назад калифорнийский город Санта-Крус первым в мире внедрил математическую модель расчёта вероятности преступлений, которая каждый день составляет новый маршрут для патрульных машин, основываясь на статистике преступлений по улицам. Учитываются день недели, время суток, наличие/отсутствие футбольных матчей по ТВ и другие факторы.

Исследователь из Бирмингемского университета Мирко Мусолези (Mirco Musolesi) применил совершенно другой подход. Его метод основан не на статистике, а на оперативных данных из сетей сотовой связи. Мусолези начал с того, что научил алгоритм с высокой степень вероятности прогнозировать перемещения каждого абонента: он даже выиграл конкурс Nokia Mobile Data, наиболее точно предсказав перемещения 25-ти добровольцев по сигналам их телефонов, истории звонков и текстовым сообщениям. Иногда алгоритм прогнозирует координаты пользователя с точностью до 20 м2.
Читать полностью »

В статье описывается метод обработки сложных событий с помощью цепочек. В качестве практического приложения была выбрана относительно простая задача — прогнозирование движения валютного курса.

При построении цепочек использовалась методология, описанная в статье “Автоматический анализ текстов без модераторов” и в комментариях к ней. После описания алгоритма будут предложена стратегия с положительным математическим ожиданием прибыли.

Введение

При обработке событий приходится искать смысл происходящего. Если с неба светит солнце и дует юго-западный ветер, то что это значит? А если вдруг потемнело и слышны глухие раскаты, то чем это грозит?

Ответ на эти вопросы лежит в будущем. Если сейчас хорошая погода, то можно идти гулять. А если вдруг сгустились тучи, то надо готовиться к дождю. Таким образом, события из настоящего становятся предпосылками для формирования будущего.

Но будущее не существует. Даже если оно предопределено, всегда может объявиться фактор, который в той или иной степени изменит результат. Можно говорить лишь о некоторой вероятности, с которой прогноз исполняется.

При прогнозировании приходится оперировать ограниченным набором информации. Чем ее больше, тем больше времени уходит на обработку. Необходимость обработки заведомо делает невозможным мгновенное реагирование. Пусть даже на обработку уходят секунды, но и за секунды многое что может произойти. И чем сложнее привлеченные методики, тем больше промежуток между появлением исходных данных и конечным результатом.

Другим фактором является то, что поведение окружающей среды определено и детерминировано далеко не всегда. Это заставляет прибегать к эмпирическим методам исследования: сначала мы фиксируем предпосылки, а потом ассоциируем их с произошедшими последствиями. Время между причиной и следствием дает дополнительную задержку.

Если поведение окружающей среды не зависит от его прошлых состояний, то ее прогнозирование невозможно — никогда не знаешь, что произойдет в следующия момент. Но на практике стабильные причинно-следственные связи все таки втречаются и существуют, порой, испокон веков.

Таким образом, задача сводится к сбору необходимой информации, эмпирическому поиску стабильных причинно-следственных связей и использовании результатов при прогнозировании.

Читать полностью »

«Техническая» часть АРСС моделирования
В предыдущей статье я уделил внимание исключительно алгоритму и «физике» метода. В этой статье будет описано немного про получение результатов и их представлении.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js