Как «моделируют будущее» в Университете ИТМО: от предсказания поведения толпы до анализа мнений в соцсетях

в 7:01, , рубрики: анализ данных, Анализ и проектирование систем, Блог компании Университет ИТМО, моделирование, Разработка под e-commerce, метки:

Можно ли предсказать поведение толпы? Ученые из Института наукоемких компьютерных технологий (НИИ НКТ) при Университете ИТМО взялись решить эту задачу. Они создали систему, моделирующую варианты развития событий в местах массового скопления людей, будь то стадион во время футбольного Чемпионата Мира или святые места в период массового паломничества.

От хаоса — к модели

Модель строится на основе особенностей толпы, таких, как социальная структура, и внешних факторов, — например, погодных условий или политической обстановки. Также задаются параметры территории, где происходит действо. В результате, ученые видят наглядную картину поведения людей в заданных условиях. Выглядит это примерно так:



Важными характеристиками толпы являются плотность и скорость передвижения. Система наглядно показывает места повышенной плотности, где нарастает напряженность и происходят чрезвычайные ситуации: давка и конфликты. Путем варьирования параметров зоны проведения мероприятия определяется ее оптимальная конфигурация для предстоящего события.

С помощью программной системы можно воссоздать любую территорию и внешние условия, а затем поместить в эту среду любую группу людей. Это открывает огромные возможности для исследований. Можно смоделировать землетрясение в Японии во время какого-нибудь праздника, когда на улицах города – тысячи людей. Никто не запрещает исследователю заменить японцев на англичан, а землетрясение – на проигрыш Манчестер Юнайтед.

Но чтобы поведение виртуальной толпы было достоверным, необходимо изучить логику поведения человека в моделируемых ситуациях. Для этого проводятся «полевые» исследования в местах массового скопления людей. Методы исследований различны. Основные: наблюдение, фото- и видеосъемка, опросы и использование специальных датчиков (GPS-трекеры, акселерометры, датчики близости).

Сергей Иванов, руководитель международной лаборатории «Городская информатика» Университета ИТМО объяснил, что для базовой работы моделей хватит и камер наружного наблюдения в разных точках территории. Выделив поток людей из видеоряда, можно подстроить модель под реальную ситуацию и сделать краткосрочные прогнозы.

Как оценить настрой толпы, не находясь в ней? Помогают соцсети. После того, как изображения с нужными хэштэгами или геопривязкой поступают на сервер, модель выделяет на них лица, по которым алгоритмы машинного обучения определяют настроение людей.

Датчики близости — устройства, «видящие» друг друга на заданном расстоянии и фиксирующие это — не менее перспективны. Если такое устройство привязать к конкретному человеку, можно восстановить граф его перемещений, а также определить, как другие факторы (дистанция до родственников или друзей) влияют на их движение в толпе. Однако, использование датчиков может быть проблематичным.

«Главный минус такого подхода заключается в сложной инфраструктурной подготовке экспериментов, необходимости участия добровольцев в раздаче/сборе специальных устройств и невозможности использовать полученные результаты в оперативном режиме», — говорит Иванов. Ученый добавляет, что игра, тем не менее, стоит свеч — наблюдение за отдельными людьми позволяет получить более глубокие знания о природе движения толпы.

Методы подготовки входных данных — то есть, информации о зоне проведения мероприятия — варьируются от изучения фотоснимков до восстановления трехмерных объектов по облаку точек, полученных с помощью беспилотников и средств сканирования.

Полевое исследование с использованием этих средств было недавно проведено сотрудниками ИТМО совместно с коллегами из других стран на религиозном фестивале «Кумбха-мела», который каждые 3-4 года проходит в Индии. В течение месяца исследователи наблюдали за паломничеством порядка 70 миллионов людей к святым местам индуизма.

Ученым удалось выделить стереотипные для участников фестиваля действия и их взаимосвязи. Сценарии включали в себя «тупики», «препятствия» и «сквозные проходы», а также поведение толпы в экстремальных ситуациях, таких, как проливной дождь.

Варианты поведения рассматривались в различных внешних условиях. В Индии самым важным из них была температура воздуха, которая иногда превышала 40 градусов.

Похожее исследование было проведено на петербуржском VK fest’е в этом году. Нововведение заключалось в анализе фотографий мероприятия, опубликованных пользователями, и определении наиболее популярных зон фестиваля на основании геотегов. Больше всего людей привлекла зона «Драйв» (выставка тюнингованных автомобилей), почти не отставали от нее зоны искусства и еды.

Когда полевой этап закончен, информация обрабатывается на компьютере, а затем превращается в модель. Вот только обычным ПК гигантским объем работы по моделированию не под силу, ведь каждый элемент толпы и внешней среды представлен в виде уравнений и наборов правил. Чтобы воссоздать типичную ситуацию массового скопления людей, необходимо выполнить миллионы вычислительных операций, поэтому ученые работают с суперкомпьютерами «Ломоносов-2» и «Лобачевский» – одними из самых мощных в мире. Первый находится в МГУ, а второй – в Нижегородском Государственном Университете.

По признанию Иванова, вычисления серьезно осложняются хаотичностью движения человеческих масс, которая отражена в подходе к моделированию по методу Монте-Карло. «С одной стороны, перемещение отдельного человека в толпе определяется физической моделью, которая носит детерминированный характер, однако генерация желаний (смена точки интереса, выбор желаемой скорости, неожиданные остановки и так далее) является следствием дискретного выбора, который формализуется в терминах случайных процессов», – говорит руководитель «Городской Информатики». Для получения достоверных результатов, виртуальные эксперименты должны повторяться много раз с разными входными данными.

Подобным образом ученые уже прогнозировали возможное поведение болельщиков, направляющихся к метро от стадиона «Зенит-Арена» после матча.

Моделирование позволило выявить места с потенциально наибольшим давлением толпы. Чтобы обезопасить болельщиков, покидающих стадион после матча, можно регулировать потоки, изменяя конфигурацию ограждений или выходы со стадиона.

Не толпой единой

Алгоритмы, разработанные учеными, могут спрогнозировать не только поведение людей в толпе. Они позволяют определить пути распространения вирусных заболеваний, составить схему «наркотизации» города и даже оценить общественное мнение – то есть, смоделировать все процессы, которые связаны с контактами между людьми и их мобильностью.

Например, в Университете ИТМО работают над моделированием заболеваемости гриппом. Процесс заражения можно проиллюстрировать как для замкнутого пространства вроде поезда, так и для целого города. Во втором случае задача многократно усложняется, так как нужно учесть все особенности жизни города, отразить все социальные взаимодействия, в то время как для поезда достаточно описания стереотипного поведения пассажиров, определяемого небольшим числом правил.

Другим объектом для исследования являются социальные сети. Изучая записи пользователей Вконтакте или комментарии к видео на YouTube, можно узнать мнение, которое разделяют люди касательно власти, социальных проблем, товаров и их производителей. В частности, НИИ НКТ Университета ИТМО изучает сообщения из социальных сетей Вконтакте, Twitter, Instagram и Live Journal. Ученым при этом удается не только анализировать мнения и определять «социальные сквозняки», но и отличать ботов от реальных людей, а также оценивать влияние на сеть и общественное мнение высказываний популярных блогеров и известных личностей.

В основе данных технологий лежит концепция краулинга (crawling). В соответствии с заданной стратегией, программа просматривает ресурсы социальных сетей и заносит их в базу данных для дальнейшего анализа. Каждый ресурс, вплоть до отдельных постов, определяется набором характеристик, таких как число лайков, репостов, внешних цитирований и комментариев. Все эти данные объединяются графом связей, на основе которого производится ранжирование ресурсов по заданному критерию. По словам Сергея Иванова, подход позволяет не только моделировать распространение информации по такому графу, но и формировать стратегии противодействия «манипулированию сетевым сообществом».

Данная технология имеет широкий спектр применений. Так, в частности, краулинг и анализ социальных сетей активно используется для исследования социальных процессов в технологиях электронного правительства (eGovernance).

Кто за этим стоит: команда НИИ НКТ

НИИ НКТ стремительно развивается, а результаты его исследований демонстрируются на международных научных конференциях, включая недавнюю ICCS’2016 в Сан-Диего, США. Институт привлекает правительственные «мегагранты» и зарубежных специалистов.

Научным руководителем Лаборатории перспективных вычислительных технологий НИИ НКТ является Петер Слоот – профессор Амстердамского университета. Также иностранцы трудятся в лаборатории удаленно: в Сингапуре, Польше, Голландии – всех их привлекают российские разработки и возможность участвовать в перспективных проектах НИИ НКТ.

В 2006 году в НИИ работало всего четверо сотрудников. Спустя 10 лет их число выросло до 100, и институт продолжает искать таланты. Например, если вы – бакалавр и/или магистр прикладной математики и информатики либо смежной области (STEM – Science, Technology, Engineering and Mathematics), в частности, в направлении «ИКТ» и «программирование», с английским не ниже Upper Intermediate, а также:

  • Владеете стандартными структурами данных и алгоритмов;
  • Программируете в C ++ / C # / Java;
  • Можете применять современные математические пакеты и языки обработки данных (Python / R / MathCAD / MatLab),

то у вас есть возможность присоединиться к исследованиям НИИ НКТ ИТМО, которые не ограничиваются изучением поведения толпы. Институт планирует применять разработки в самых разных сферах – от биомедицины и урбанистики до прогнозирования и предупреждения природных и антропогенных катастроф.

Автор: Университет ИТМО

Источник

Поделиться новостью

* - обязательные к заполнению поля