- PVSM.RU - https://www.pvsm.ru -
Спутники НАСА для топографии поверхности океана и других водных территорий (SWOT) первыми начнут присылать данные в облако Earthdata [1]
Не секрет, что современные научные приборы генерируют огромные объёмы данных. Например, Большой адронный коллайдер выдавал 1 петабайт в секунду [2], а крупнейший радиотелескоп MeerKAT — до 1 петабайта сжатых данных в сутки [3].
У НАСА объёмы скромнее, но тоже значительные. Например, система Earth Science Data and Information System (ESDIS [4]) предусматривает сбор данных с десятка миссий по изучению Земли — около 100 терабайт в день. По плану, в ближайшие несколько лет объём хранения вырастет с 32 до 247 петабайт.
Ради экономии НАСА планировало перенести данных со своих дата-центров Distributed Active Archive Centers (DAAC) в облако Amazon Web Services. Но в своих финансовых расчётах агентство не учло важный нюанс, который сильно снижает экономическую привлекательность облачного хранилища. А именно, стоимость скачивания данных.
На сегодня в системе НАСА 12 дата-центров [5]. Все они находятся на территории США.
Дата-центры являются частью информационной системы Earth Observing System Data and Information System (EOSDIS [6]).
НАСА решило постепенно отказаться от управления этой инфраструктурой, ибо это непрофильная деятельность для космического агентства. Поэтому с 2019 года организован перенос данных в облако AWS, пишет [7] The Register. Миграция происходит в рамках проекта, получившего название облако Earthdata [1].
Первый этап перехода от локального хранения данных к облачному был запланирован на I квартал 2020 года, затем остальные. НАСА планирует, что для полного отказа от локального хранения данных потребуется несколько лет аккуратного переноса всех систем.
По прогнозу, около 15-ти предстоящих миссий, таких как NASA-ISRO Synthetic Aperture Radar (NISAR [8]) и спутники Surface Water and Ocean Topography (SWOT [9]), будут генерировать более 100 терабайт данных в день. Это две первые миссии, которые миссиями, которые начнут сбрасывать данные непосредственно в облако Earthdata.
Таким образом, агентство прогнозирует, что к 2025 году у него будет 247 петабайт данных для обработки. НАСА считает переход в облако отличной идеей. В документации по миграции говорится: «Облако предоставит более широкие возможности для быстрого доступа и обработки больших объёмов данных, что позволит проводить новые виды исследований. Данные, которые ранее были географически распределены, теперь будут доступны через облако, экономя время и ресурсы».
Проблема в том, что НАСА не совсем реалистично оценивает будущие расходы на облачный
«В частности, агентство сталкивается с возможностью существенного увеличения затрат на вывод данных из облака [которые сегодня отсутствуют]», — сказано в отчёте генерального инспектора. «Когда конечные пользователи загружают данные из облака Earthdata, плата за каждую передачу информации будет взиматься с агентства, а не пользователей. В конечном счете, ESDIS будет нести расходы и на облачный
По их мнению, расходы могут оказаться гораздо выше, чем запланировано. А если NASA введёт ограничения на объём исходящих данных, то это ударит по научному сообществу: «В результате внедрение облачных технологий может увеличить затраты и бремя управления».
Аудиторы рекомендуют дождаться, когда проекты NISAR и SWOT заработают и пришлют достаточно данных — и сразу провести независимый анализ, чтобы определить долгосрочный финансовый смысл миграции со своих дата-центров в облако.
Автор: ITSumma
Источник [12]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/amazon-web-services/350264
Ссылки в тексте:
[1] Earthdata: https://earthdata.nasa.gov/eosdis/cloud-evolution
[2] 1 петабайт в секунду: https://www.computerra.ru/241513/kak-hranit-petabajty-dannyh-adronnogo-kollajdera/
[3] до 1 петабайта сжатых данных в сутки: https://habr.com/ru/post/396107/
[4] ESDIS: https://earthdata.nasa.gov/esdis
[5] 12 дата-центров: https://earthdata.nasa.gov/eosdis/daacs
[6] EOSDIS: https://earthdata.nasa.gov/eosdis
[7] пишет: https://www.theregister.co.uk/2020/03/19/nasa_cloud_data_migration_mess/
[8] NISAR: https://nisar.jpl.nasa.gov/
[9] SWOT: https://swot.jpl.nasa.gov/
[10] хостинг: https://www.reg.ru/?rlink=reflink-717
[11] аудиторском отчёте: https://www.oversight.gov/sites/default/files/oig-reports/IG-20-011.pdf
[12] Источник: https://habr.com/ru/post/493290/?utm_campaign=493290&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.