- PVSM.RU - https://www.pvsm.ru -
Банки данных помогают делиться результатами экспериментов и измерений, играют важную роль в формировании академической среды и в процессе развития специалистов.
Расскажем как о датасетах, полученных с помощью дорогостоящего оборудования (источниками этих данных нередко являются крупные международные организации и научные программы, чаще всего связанные с естественными науками), так и о государственных банках данных.
Фото Jan Antonin Kolar [2] — Unsplash
Data.gov.ru [3] — хорошо знакомый хабражителям государственный проект в сфере открытых данных. Его московский аналог — Data.mos.ru [4]. Из зарубежных вариантов стоит отметить Data.gov [5] — площадку с открытыми данными от правительства США (единый каталог [6] с фильтрами).
Университетская информационная система [7] — проект МГУ, объединяющий базы со статистической информацией о социальном и экономическом положении в стране, а также публикации из государственных и научных источников. Данные берутся как из Росстата, так и из исследований, проведенных на базе МГУ. Ресурсом можно воспользоваться и без предварительной регистрации, но для полноценного доступа потребуется подать заявку.
Картографическая база [8] Всероссийского геологического института им. Карпинского. Информация о природных ресурсах страны, собранная за время существования учреждения, была нанесена на цифровые карты. Интерфейс площадки позволяет сопоставить OpenStreetMap или Я.Карты с рядом доп. слоев с информацией о магнитном поле, полезных ископаемых и др.
GEOSS [9] — портал для поиска данных наблюдения Земли со спутников и дронов различных типов. Архив ресурса собирают силами 90 организаций [10] по всему миру. Чтобы найти интересующие сведения, достаточно выделить нужную область на карте или вбить в поиск ключевые слова.
MAST [11] — архив, который финансируется NASA. Представленные данные собраны орбитальными телескопами [12] — изучать и скачивать исследования можно с помощью поиска с фильтрами [13].
Фото Max Bender [14] — Unsplash
OpenEI [15] — платформа для поиска открытых данных об использовании энергии, в частности о возобновляемых энергоресурсах и новых технологиях в отрасли. Сайт организован по принципу вики — достоверность данных проверяется сообществом [16].
Experimental Nuclear Reaction Data (EXFOR) [17] — библиотека, содержащая данные 22615 экспериментов с элементарными частицами. В комплекте с базами данных CINDA (Computer Index of Nuclear Reaction Data) и IBANDL (Ion Beam Analysis Nuclear Data Library) является одним из крупнейших банков данных по ядерной физике. Курируется Брукхейвенской национальной лабораторией в США, но содержит эксперименты со всего мира — включая Россию и Китай [18].
National Centers for Environmental Information [19] — архив экологических данных. Здесь вы получите доступ к двадцати петабайтам океанических и геофизических данных, а также сведениям об атмосфере и прибрежных зонах. В частности, тут найдется информация о глубине океана, поверхности Солнца, записи об осадочных породах и спутниковые снимки. Для поиска нужного датасета можно воспользоваться каталогом [20].
ADS [21] — репозиторий для поиска археологических данных под управлением Йоркского университета. Здесь есть старые и новые научные публикации, сведения о раскопках и артефактах. Для поиска предлагают три категории: ArchSearch, Archives и Library. В первой хранятся данные о раскопках и артефактах. Во второй — архив всех загруженных материалов. В третьей — публикации из журналов, книги и исследования. Есть опции поиска по странам, эпохам и типам объектов.
DRYAD [22] — этот сервис помогает искать информацию для научных исследований по банку данных из 80 тысяч файлов. Исследования и статьи из банка можно использовать по лицензии CC0 [23]. Тематика материалов включает разные области знаний, однако большинство исследований связаны с медициной и компьютерными науками. Согласно внутренней статистике [24], в 2018 году пользователи сайта наиболее интересовались песнями китов, температурной толерантностью морских обитателей, и нейронной активностью в височной доле человеческого
В лаборатории «Перспективные наноматериалы и оптоэлектронные устройства [26]» Университета ИТМО
GenBank [27] — ДНК-библиотека, которую предоставляет Национальный центр биотехнологической информации США (NCBI), а также банки данных Европы и Японии. Доступен поиск по идентификаторам [28] в специальном поисковом движке, с помощью инструмента BLAST [29] или программным путем [30].
PubChem [31] — база данных соединений и биопроб, которую содержит национальный центр биотехнологической информации США. Есть веб-интерфейс с расширенным поиском (пример про побочные эффекты воды [32]). Данные распространяются на правах общественного достояния.
Protein Data Bank (RCSB PDB) [33] — банк изображений белков и нуклеиновых кислот, история которого отсчитывается еще с 1971 года. Изначально разрабатывался, как внутренний проект Брукхейвенской национальной лаборатории, но в последствии превратился в крупнейшую международную базу данных своего типа. Большинство академических журналов, связанных с биохимией, обязуют авторов размещать на сайте полученные в ходе исследований белковые модели.
InterPro [34] — база данных, объединяющая множество датасетов различных научных проектов. Включает в себя SMART [35] — программу для анализа доменов в белковых последовательностях, основанную на технологиях машинного обучения и датасете из 1200 моделей. Поддерживается Европейским институтом биоинформатики.
Автор: itmo
Источник [40]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/otkry-ty-e-danny-e/318763
Ссылки в тексте:
[1] Toolbox для исследователей — выпуск первый: самоорганизация и визуализация данных: https://habr.com/ru/company/spbifmo/blog/451126/
[2] Jan Antonin Kolar: https://unsplash.com/photos/lRoX0shwjUQ
[3] Data.gov.ru: https://data.gov.ru/
[4] Data.mos.ru: https://data.mos.ru/
[5] Data.gov: https://www.data.gov/
[6] единый каталог: https://catalog.data.gov/dataset#topic=uncategorized_navigation
[7] Университетская информационная система: https://uisrussia.msu.ru
[8] Картографическая база: http://webmapget.vsegei.ru/index.html
[9] GEOSS: http://www.geoportal.org/
[10] 90 организаций: http://www.geoportal.org/community/guest/data-providers
[11] MAST: http://archive.stsci.edu/
[12] орбитальными телескопами: https://archive.stsci.edu/missions-and-data
[13] поиска с фильтрами: http://archive.stsci.edu/hlsp/
[14] Max Bender: https://unsplash.com/photos/iF5odYWB_nQ
[15] OpenEI: https://openei.org/wiki/Main_Page
[16] сообществом: https://openei.org/wiki/OpenEI:Get_Involved
[17] Experimental Nuclear Reaction Data (EXFOR): https://www-nds.iaea.org/exfor/
[18] Россию и Китай: http://www-nds.ciae.ac.cn/exfor/x4stat/endf_stat.htm
[19] National Centers for Environmental Information: https://www.ncei.noaa.gov/
[20] каталогом: https://www.ncei.noaa.gov/access
[21] ADS: http://archaeologydataservice.ac.uk/
[22] DRYAD: http://datadryad.org/
[23] CC0: http://creativecommons.org/publicdomain/zero/1.0/
[24] статистике: https://blog.datadryad.org/2019/01/28/most-popular-data-from-2018/
[25] мозга: http://www.braintools.ru
[26] Перспективные наноматериалы и оптоэлектронные устройства: https://habr.com/ru/company/spbifmo/blog/450552/
[27] GenBank: https://www.ncbi.nlm.nih.gov/genbank/
[28] поиск по идентификаторам: https://www.ncbi.nlm.nih.gov/nucleotide/
[29] BLAST: https://www.ncbi.nlm.nih.gov/blast/producttable.shtml
[30] программным путем: https://www.ncbi.nlm.nih.gov/books/NBK25501/
[31] PubChem: https://pubchem.ncbi.nlm.nih.gov/
[32] побочные эффекты воды: https://pubchem.ncbi.nlm.nih.gov/compound/962#section=Toxicity
[33] Protein Data Bank (RCSB PDB): https://www.rcsb.org/
[34] InterPro: http://www.ebi.ac.uk/interpro/
[35] SMART: http://smart.embl-heidelberg.de/
[36] Что делают в лаборатории квантовых материалов Университета ИТМО: https://habr.com/ru/company/spbifmo/blog/449778/
[37] Механизированные руки и манипуляторы — чем занимается лаборатория робототехники: https://habr.com/en/company/spbifmo/blog/441458/
[38] Экскурсия по нашей лаборатории киберфизических систем: https://habr.com/ru/company/spbifmo/blog/435250/
[39] Фаблаб Университета ИТМО: DIY-коворкинг для творческих людей — показываем, что внутри: https://habr.com/en/company/spbifmo/blog/434976/
[40] Источник: https://habr.com/ru/post/453408/?utm_source=habrahabr&utm_medium=rss&utm_campaign=453408
Нажмите здесь для печати.