Машинное обучение и поиск темной материи: соревнование от ЦЕРНа и Яндекса

в 11:47, , рубрики: big data, data science, kaggle, physics, python, Блог компании Яндекс, машинное обучение, Программирование

Яндекс уже несколько лет сотрудничает с ЦЕРНом. Он сделал для учёных-физиков поиск по событиям в БАК, предоставил свои вычислительные ресурсы и технологии обработки данных — в том числе Матрикснет и ClickHouse. В 2014 году Яндекс стал ассоциированным членом CERN openlab.

Школа анализа данных Яндекса тоже принимает участие в экспериментах ЦЕРНа. Машинное обучение в наши дни становится «микроскопом» для современных учёных, которым необходимо изучать большие объемы данных и находить в них различные закономерности. В этом году ШАД совместно с лабораторией Методов анализа больших данных Вышки и Имперским колледжем Лондона организует в Великобритании международную школу, которая посвящена способам применения современных технологий в научных исследованиях.

Машинное обучение и поиск темной материи: соревнование от ЦЕРНа и Яндекса - 1
Эксперимент OPERA — из Швейцарии в Италию (картинка взята с сайта коллаборации OPERA)

Сегодня в рамках школы начинается открытое соревнование, участники которого будут ни много ни мало искать нейтрино. Принять участие в поисках мы приглашаем всех желающих. Им предстоит обрабатывать данные с международного эксперимента OPERA. Для этого будут предоставлены исходные данные — результаты сканирования слоев фотопленок одного «кирпича» эксперимента OPERA. Соревнование состоит из двух этапов. На первом этапе участники будут искать отдельный ливень в «кирпиче», первая вершина которого известна, на втором — несколько ливней, рассредоточенных по объему «кирпича» без дополнительной информации. Победители смогут рассказать о своих решениях ученым, работающим в ЦЕРНе.

Эксперимент OPERA начинается в ЦЕРНе, откуда пучок нейтрино направляется — сквозь землю! — в лабораторию Гран-Сассо в Италии. По пути он претерпевает некоторые изменения — «осцилляции», которые измеряются в Италии. Для этого в Гран-Сассо построен детектор внушительных размеров (10×10×20 метров) и весом аж 4000 тонн. Назначение детектора — «ловить» нейтрино.

О поиске нейтрино

Сделать это не так просто, ведь нейтрино практически не взаимодействует с веществом. К примеру, огромное число — миллиарды миллиардов — нейтрино, испущенных Солнцем, за день пролетает сквозь каждого из нас. И мы никак это не ощущаем.

Однако, если пропустить нейтрино через свинцовую пластину, то оно может рассеяться на атомах свинца. В результате рассеяния появляются заряженные частицы, обнаружить которые гораздо проще. К примеру, если за свинцовой пластиной расположить слой фотопленки, то пролетающая заряженная частица оставит в нем след. Этот способ позволяет проследить появление частицы, а также направление ее движения и даже импульс и энергию.

Об электромагнитных ливнях

Рассеяние нейтрино в эксперименте OPERA порождает заряженную частицу —
к примеру, электрон — с большой энергией. Такой электрон может испустить фотон. Фотон, в свою очередь, может распасться на две заряженные частицы — электрон и позитрон (античастица электрона c положительным зарядом). Появившиеся электрон и позитрон могут испустить фотоны, фотоны — распасться на электроны и позитроны и так далее. В результате, один исходный электрон порождает целый поток электронов и позитронов. Такой процесс называется электромагнитным ливнем.

Машинное обучение и поиск темной материи: соревнование от ЦЕРНа и Яндекса - 2

Условное обозначение электромагнитного ливня. Здесь исходный фотон (γ-квант) распадается на электрон e- и позитрон e+ и так далее

Процесс развития ливня является энергозатратным. Когда энергия рожденных частиц становится недостаточной для образования новых частиц, ливень прекращается.
Не забываем, что распады происходят «на лету», и что заряженные частицы прочерчивают треки в фотопленках.

О соревновании

Итак, задача, стоящая перед участниками соревнования, будет заключаться в поиске электромагнитных ливней. Отметим, что ливни могут производить заряженные частицы, не только рожденные при рассеянии нейтрино, но и любые другие. Главное, чтобы эти частицы обладали большой энергией.

По виду ливня, однако, можно определить, какая частица породила его. Сразу скажем, что найти следы именно нейтрино — большая удача. Скорее всего, участникам удастся обнаружить ливни, порожденные другими частицами.

Об эксперименте OPERA

Вернемся к эксперименту. Несколько десятков свинцовых пластин, чередующихся со слоями фотопленок, группируются в блоки — «кирпичи». Из таких «кирпичей» составлены стены датчиков высотой 10 метров, которые и представляют собой детектор в эксперименте OPERA.

Машинное обучение и поиск темной материи: соревнование от ЦЕРНа и Яндекса - 3
Детектор OPERA. Стены, составленные из “кирпичей”, окрашены в черный цвет (картинка взята с сайта коллаборации OPERA)

Когда появляется подозрение, что в «кирпиче» произошло рассеяние нейтрино и, соответственно, родились заряженные частицы, то такой кирпич изымается и направляется на исследование. Специальная система сканирует слои фотопленок и восстанавливает треки (следы), оставленные заряженными частицами.

О машинном обучении

Вроде бы ничего сложного, но данные, приходящие со сканирующей системы, выглядят так:

Машинное обучение и поиск темной материи: соревнование от ЦЕРНа и Яндекса - 4
Результаты сканирования слоев фотопленок одного из «кирпичей» эксперимента

На этом рисунке показана часть одного «кирпича», а именно слои фотопленок с номерами от 13 до 22 (всего в блоке 57 слоев). Для удобства отображения, расстояния между слоями сокращено («выкинуты» свинцовые пластины).
Отображенные здесь треки — далеко не все. На самом деле их в десять раз больше! Если отобразить все треки, то получится почти сплошной синий фон.
Почему их так много? Дело в том, что присутствует огромное количество «шумовых» треков — тех, которые оставляют, к примеру, заряженные частицы, прилетающие из космоса и не имеющие отношения к эксперименту.
Разобраться в этом хаосе и выделить полезные треки кажется невозможным. На помощь приходят методы машинного обучения. К примеру, после обработки этого «кирпича», может быть получена следующая картина:

imagefig_bck_signal
Результаты обработки данных методами машинного обучения

Красным выделены полезные, сигнальные треки. Видно, что они являются следами частиц, составляющих электромагнитный ливень.
Можно проследить «историю» этого ливня. К примеру, верхняя частица, при переходе из 15-го слоя в 16-ый столкнулась с атомом свинца и поменяла направление движения. При этом был испущен фотон, электрон потерял энергию и, видимо, был поглощен в свинцовой пластине между 16-ым и 17-ым слоями.

Об эксперименте SHiP

С задачей поиска нескольких ливней в одном «кирпиче» столкнулись организаторы эксперимента SHiP. Этот амбициозный эксперимент, активно развиваемый в ЦЕРНе, нацелен на поиск частиц, которые никто до сих пор не видел и которые помогут объяснить загадку темной материи.

По одной из гипотез, частицы легкой темной материи могут вести себя аналогично нейтрино. В эксперименте SHiP планируется использовать аналогичный детектор — стену из «кирпичей» — как и в OPERA. В отличие от детектора OPERA «кирпичи» SHiP будут стоять гораздо ближе к источнику нейтрино (десятки метров, а не сотни километров), поэтому количество электромагнитных ливней в них будет гораздо выше. Соответственно, необходимы более чувствительные алгоритмы, способные распознать и обработать несколько десятков ливней в одном кирпиче.

О победителях

Победители соревнования смогут принять участие во встрече коллаборации SHiP, посвященной проблемам эксперимента. На ней они смогут рассказать о своих решениях ученым, непосредственно работающим над экспериментом.

Автор: nau4no

Источник

Поделиться

* - обязательные к заполнению поля