Машинное обучение всё чаще используется в физике частиц

Машинное обучение всё чаще используется в физике частиц - 1

Эксперименты на Большом адронном коллайдере каждую секунду выдают порядка миллиона гигабайт данных. Даже после уменьшения и сжатия, данные, полученные на БАК всего за час, по объёму оказываются сравнимыми с данными, полученными Facebook за целый год.

К счастью, специалистам по физике частиц не приходится разбираться с этими данными вручную. Они работают совместно с разновидностью искусственного интеллекта, обучающегося вести самостоятельный анализ данных при помощи технологии машинного обучения.

«По сравнению с традиционными компьютерными алгоритмами, которые мы разрабатываем для проведения определенного вида анализа, мы делаем алгоритм машинного обучения так, чтобы он сам решал, какими анализами заниматься, что в результате экономит нам несчётное количество человеко-часов разработки и анализа», — говорит физик Александр Радович из Колледжа Уильяма и Мэри, работающий в нейтринном эксперименте Nova.

Радович и группа исследователей очертили круг текущего применения и будущих перспектив МО в физике частиц в сводке, опубликованной в Nature в августе 2018.

Просеивая большие данные

Чтобы обработать огромные объёмы данных, получаемых в современных экспериментах, — как те, что идут на БАК, — исследователи применяют «триггеры» – специальное оборудование, работающее совместно с ПО, в реальном времени решающее, какие данные оставить для анализа, а от каких избавиться.

На детекторе LHCb ^[1] в эксперименте, который может пролить свет на то, почему во Вселенной материи гораздо больше, чем антиматерии, алгоритмы МО принимают по меньшей мере 70% подобных решений, говорит учёный Майк Уильямс из Массачусетского технологического института, работающий на LHCb, один из авторов упомянутой сводки. «МО играет роль почти во всех аспектах работы с данными в эксперименте, начиная от триггеров, и заканчивая анализом оставшихся данных», — говорит он.

Машинное обучение демонстрирует значительные успехи в области анализа. На огромных детекторах ATLAS и CMS на БАК, благодаря которым была открыта частица Хиггса, стоят миллионы сенсоров, сигналы которых необходимо свести вместе для получения осмысленных результатов.

«Эти сигналы составляют сложное пространство данных», — говорит Майкл Каган из Национальной ускорительной лаборатории SLAC Энергетического департамента США, работающий на детекторе ATLAS, и принимавший участие в создании сводки. «Нам нужно понять взаимосвязь между ними, чтобы сделать выводы – например, что определённый след частицы в детекторе оставил электрон, фотон или что-то ещё».

МО выгодно и для экспериментов с нейтрино. NOva, который обслуживает Фермилаб ^[2], изучает, как нейтрино переходят из одного вида в другой при путешествии сквозь Землю. Эти нейтринные осцилляции ^[3] потенциально способны раскрыть существование новых типов нейтрино, которые, согласно некоторым теориям, могут оказаться частицами тёмной материи. Детекторы NOva выискивают заряженные частицы, появляющиеся, когда нейтрино сталкиваются с материалом в детекторе, а алгоритмы МО определяют их.

От машинного обучения к глубинному обучению

Недавнее продвижение в области МО часто называют глубинным обучением, и оно обещает ещё больше расширить область применения МО в физике частиц. Под ГО обычно имеют в виду использование нейросетей: компьютерных алгоритмов с архитектурой, вдохновлённой плотной густой нейронов человеческого мозга ^[4].

Эти нейросети самостоятельно обучаются определённым задачам анализа при помощи тренировки, когда они обрабатывают пробные данные, например, из симуляций, и получают обратную связь о качестве своей работы.

До недавнего времени успехи нейросетей были ограничены, поскольку их было очень сложно тренировать, говорит соавтор работы Казухиро Терао, исследователь со SLAC, работающий в нейтринном эксперименте MicroBooNE, изучающем нейтринные осцилляции в рамках краткосрочной программы Фермилаб. Эксперимент станет частью будущего Глубокого подземного нейтринного эксперимента ^[5]. «Эти трудности ограничивали наши возможности работой с простейшими нейросетями глубиной в пару слоёв, — говорит он. – Благодаря продвижению алгоритмов и вычислительного оборудования, теперь нам гораздо больше известно о том, как создавать и тренировать более способные нейросети с сотнями или тысячами слоёв».

Многие прорывы в ГО обуславливаются коммерческими разработками технологических гигантов и тем взрывом данных, что они создали за последние два десятилетия. «К примеру, NOva использует нейросеть, сделанную по подобию архитектуры GoogleNet, — говорит Радович. – Это улучшило эксперимент до такой степени, которую можно было бы достичь, только увеличив сбор данных на 30%».

Плодотворная почва для инноваций

Алгоритмы МО день ото дня становятся всё более сложными и тонко настроенными, открывая беспрецедентные возможности для решения задач из области физики частиц. Многие из новых задач, для которых их можно применять, связаны с компьютерным зрением, как говорит Каган. «Это похоже на распознавание лиц, но только в физике частиц свойства изображений более абстрактны и сложны, чем уши или носы».

Данные некоторых экспериментов, например, NOvA и MicroBooNE, довольно легко можно превратить в настоящие изображения, и ИИ сразу же можно использовать для определения их особенностей. С другой стороны, изображения по результатам экспериментов на БАК сначала необходимо реконструировать на основе запутанного набора данных, полученных с миллионов сенсоров.

«Но даже если данные и не выглядят, как изображения, мы всё равно можем применять методы из компьютерного зрения, если правильно обработаем данные», — говорит Радович.

Одна из областей, в которых такой подход может оказаться очень полезным – это анализ джетов частиц, возникающих в большом количестве на БАК. Джеты – это узкие струи из частиц, следы которых чрезвычайно сложно отделить друг от друга. Технология компьютерного зрения может помочь разбираться в этих джетах.

Ещё одно новое применение ГО – симуляция данных по физики частиц, предсказывающих, допустим, что случится в столкновениях частиц на БАК, которую можно сравнить с реальными данными. Такого рода симуляции обычно работают медленно и требуют невероятно больших вычислительных мощностей. ИИ же мог бы проводить такие симуляции гораздо быстрее, что в итоге могло бы стать полезным дополнением традиционных методов исследований.

«Всего лишь несколько лет назад никому не могло прийти в голову, что глубинные нейросети можно натренировать на то, чтобы им „виделись“ данные на основе случайного шума, — говорит Каган. – Хотя эта работа находится ещё на очень ранней стадии, она уже выглядит достаточно многообещающей, и, вероятно, поможет решать проблемы с данными в будущем».

Польза здорового скептицизма

Несмотря на очевидные прорывы, энтузиасты МО часто сталкиваются со скептицизмом со стороны их коллег, в частности, поскольку алгоритмы МО по большей части работают по типу «чёрных ящиков», не давая практически никакой информации по поводу того, как именно они пришли к определённому заключению.

«Скептицизм очень здоровый, — говорит Уильям. – Если мы используем МО для триггеров, отбрасывающих какие-то данные, как, например, на LHCb, то нам нужно чрезвычайно аккуратно подходить к этому вопросу и очень высоко задирать планку».

Следовательно, чтобы укрепить позиции МО в физике частиц, необходимо постоянно пытаться улучшать понимание того, как работают алгоритмы, и по возможности делать перекрестное сравнение с реальными данными.

«Нам постоянно надо пытаться понять, что делает компьютерный алгоритм, и оценивать его результаты, — говорит Терао. – Это справедливо для любого алгоритма, не только МО. Поэтому, скептицизм не должен тормозить прогресс».

Быстрое продвижение уже позволяет некоторым исследователям мечтать о том, что может стать возможным в недалёком будущем. «Сегодня мы по большей части используем МО для поиска особенностей в наших данных, способных помочь нам ответить на некоторые вопросы, — говорит Терао. – А лет через десять алгоритмы МО, возможно, сумеют самостоятельно ставить собственные вопросы и понимать, что обнаружили новую физику».

Автор: SLY_G

Источник ^[6]

Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/fizika/291500

Ссылки в тексте:

[1] LHCb: https://ru.wikipedia.org/wiki/LHCb

[2] Фермилаб: https://ru.wikipedia.org/wiki/%D0%A4%D0%B5%D1%80%D0%BC%D0%B8%D0%BB%D0%B0%D0%B1

[3] нейтринные осцилляции: https://ru.wikipedia.org/wiki/%D0%9D%D0%B5%D0%B9%D1%82%D1%80%D0%B8%D0%BD%D0%BD%D1%8B%D0%B5_%D0%BE%D1%81%D1%86%D0%B8%D0%BB%D0%BB%D1%8F%D1%86%D0%B8%D0%B8

[4] мозга: http://www.braintools.ru

[5] Глубокого подземного нейтринного эксперимента: https://ru.wikipedia.org/wiki/Deep_Underground_Neutrino_Experiment

[6] Источник: https://habr.com/post/422173/?utm_campaign=422173

Нажмите здесь для печати.