- PVSM.RU - https://www.pvsm.ru -

ЦЕРН выложил в открытый доступ 300 ТБ данных, виртуальную машину Linux CERN 6 и инструменты для анализа

ЦЕРН выложил в открытый доступ 300 ТБ данных, виртуальную машину Linux CERN 6 и инструменты для анализа - 1

В эти выходные ЦЕРН порадовал физиков со всего мира, опубликовав в открытом доступе 300 терабайт данных с коллайдера. Студенты и школьники могут скачать эти данные и использовать для курсовых и лабораторных работ. Возможно, какой-нибудь любитель даже обнаружит скрытые корреляции, которые ускользнули от внимания специалистов ЦЕРН.

Причины такого решения объяснила [1] Кати Лассила-Перини, работающая на детекторе компактный мюонный соленоид [2]: «После того, как мы исчерпали наши возможности по анализу данных, мы не видим причин, почему не сделать их доступными для всех, — сказала она. — Здесь многочисленные выгоды: начиная с того, что они подогреют интерес старшеклассников к науке, и заканчивая подготовкой специалистов по физике элементарных частиц завтрашнего дня. И лично для меня, как координатора проекта хранения данных компактного мюонного соленоида, это важная часть обеспечения доступности наших исследовательских данных».

Сами данные получены во время экспериментов 2011 года, в основном, от столкновения протонов с энергией 7 тераэлектронвольт. При таких столкновениях порождается множество редких элементарных частиц, которые разлетаются в разные стороны и регистрируются детекторами.

ЦЕРН выложил в открытый доступ 300 ТБ данных, виртуальную машину Linux CERN 6 и инструменты для анализа - 2

Для обработки и анализа данных ЦЕРН предоставляет инструментарий [3]. Там есть уже готовая виртуальная машина CernVM [4] с операционной системой Linux CERN 6 и всеми установленными программами. Виртуальная машина открывается в VirtualBox или другом менеджере под Linux или Windows. Отдельные инструменты ЦЕРН с открытым исходным кодом опубликованы в репозитории на Github [5].

Ссылки на все наборы данных и программы собраны на странице CMS Open Data [6]. Там есть «сырые» данные без обработки в формате AOD (Analysis Object Data), данные моделирования для экспериментов 2011 года в формате AODSIM и примеры упрощённых наборов данных [7] для использования в различных приложениях и для анализа.

В прошлый раз ЦЕРН публиковал данные с экспериментов в открытом доступе в ноябре 2014 года [8]: тогда выложили 27 терабайт, собранные в 2010 году.

Автор: alizar

Источник [9]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/linux/118991

Ссылки в тексте:

[1] объяснила: http://cms.web.cern.ch/news/cms-releases-new-batch-research-data-lhc

[2] компактный мюонный соленоид: http://home.cern/about/experiments/cms

[3] инструментарий: http://opendata.cern.ch/search?p=Run2011A%20collection%3ACMS-Tools

[4] виртуальная машина CernVM: http://opendata.cern.ch/VM/CMS

[5] репозитории на Github: https://github.com/cms-outreach

[6] CMS Open Data: http://opendata.cern.ch/about/CMS

[7] упрощённых наборов данных: http://opendata.cern.ch/collection/CMS-Derived-Datasets

[8] ноябре 2014 года: http://cms.web.cern.ch/news/cms-releases-first-batch-high-level-lhc-open-data

[9] Источник: https://geektimes.ru/post/274841/