- PVSM.RU - https://www.pvsm.ru -

IaaS и наука: Как это работает. Часть 2

IaaS и наука: Как это работает. Часть 2 - 1 [1]

/ фото Matteo Bagnoli [2] CC [3]

В прошлый раз [4] мы начали рассказывать о влиянии IaaS [5]-технологий на различные научные сферы деятельности. Добро пожаловать во вторую часть поста, где мы поговорим о том, как облачные вычисления помогают проводить исследования в биологии, генетике, географии и медицине.

Биология и генетика

Одним из первых и самых известных случаев применения облачных распределенных вычислений можно считать проект «Геном человека», завершенный в 2003 году. Его целью было определение последовательности молекул ДНК и идентификация 25 тыс. индивидуальных генов.

Генетическая информация, собранная в ходе проекта, хранится в базах данных – это уникальный источник знаний, анализируемый учеными мира до сих пор. Национальный центр биотехнологической информации США и его партнёрские организации в Европе и Японии хранят [6] геномные последовательности в базе данных GenBank, японской базе данных ДНК (DDBJ) или европейской EMBL. Они надеются, что эта информация поможет сделать новые открытия в сферах генетики и биоинженерии.

Для поддержания их работы требуется большое количество вычислительных ресурсов. Поэтому не удивительно, что появилась необходимость в изменении технических подходов. Сообщество обратилось к облачным технологиям.

Главной особенностью облачных технологий, имеющей значение для геномной информатики, является способность хранения огромных сводов данных в облаке. Данные записываются на виртуальные диски, которые можно подключать к виртуальным машинам как обычные хранилища. На сегодняшний день вся база данных GenBank хранится в виде образов дисков, которые пользователи загружают и выгружают по желанию.

Облачные вычисления также сказались на работе разработчиков приложений, имеющих отношение к генной инженерии. Они получили возможность представлять свои продукты в форме виртуальных машин. Например, многие группы, занимающиеся аннотацией генов, разработали собственные процессы для идентификации и классификации генов и других функциональных элементов. К примеру, Калифорнийский Университет в Санта-Круз и Ensembl занимаются поддержкой данных и аннотаций, а также инструментов для визуализации и поиска в базах геномных последовательностей.

Несмотря на то что многие из разработанных инструментов оставались открытыми, ученые испытывали некоторые затруднения при передаче их другим исследовательским группам. Это в первую очередь было связано с различиями в конфигурациях программ и настройках отдельных сайтов. Облако позволило «упаковать» созданные приложения в образы виртуальных машин – в таком виде их легко передавать, настраивать и запускать, обходя стороной процесс установки ПО.

Виртуализация изолирует пользователей от инфраструктуры и обеспечивает гибкость в достижении целей. IaaS предлагает полнофункциональную компьютерную инфраструктуру, предоставляя все виды виртуализированных ресурсов. В качестве примера IaaS в среде биоинформатики можно привести разработку BioLinux – публичную ВМ для высокопроизводительных вычислений – и CLoVR – портативную ВМ для проведения автоматического секвенирования.

География

Географические информационные системы (ГИС) – это набор инструментов, собирающих, хранящих, анализирующих, управляющих и формализующих данные, связанные с географическим положением. ГИС играют важную роль во многих сферах деятельности и представляют собой «сплав» картографии, статистического анализа, аппаратного и программного обеспечения.

Для управления данными используются различные способы группировки и преобразования, например, приведение геоданных к единому масштабу. Для их хранения используются реляционные БД с технологиями создания отчетов.

ГИС позволяют производить запрос и анализ разной сложности: от простого поиска объектов на карте, до поиска данных по сложным шаблонам, например, выделение населенных пунктов, попадающих в зону поражения в случае аварии на АЭС.

Традиционным результатом обработки, анализа и отображения пространственных географических данных является карта, которая дополняется отчетными документами, рельефными цветными изображениями реальных и смоделированных объектов, фотографиями, графиками, диаграммами.

Помимо этого, современные ГИС имеют большое количество специальных функций, призванных облегчить жизнь пользователей. Часть из них применяется в том числе в навигационных системах: поиск кратчайшего пути, прокладка маршрута и т. д.

IaaS и наука: Как это работает. Часть 2 - 2

ГИС часто используется для принятия взвешенных решений на основании геопространственных данных. Облачная реализация открыла для исследователей и ИТ-организаций, пользующихся географическими информационными системами, новые горизонты.

Облачные системы ГИС предлагают надежные инструменты, реализующие методы геоинформатики, и мощные программно-аппаратные средства: географические серверы с открытым доступом, устройства для формирования электронных карт и алгоритмы многофакторного анализа. Более того, использование облачных технологий позволяет оптимизировать процесс создания локальных ГИС.

В этом случае у компании нет необходимости создавать сервисный центр и покупать собственное дорогостоящее оборудование и, следовательно, не нужно содержать обсуживающий ИТ-персонал. Также отпадает необходимость в покупке космических снимков и карт от сторонних разработчиков за счет подключения таких сервисов, как Google Maps и Bing Maps.

Все эти преимущества способствуют массовому переходу на облачные технологии в среде ГИС. Такие организации, как ESRI и GIS Cloud Ltd, уже осуществили переход на облачные вычисления, предлагая пользователям геоинформационные системы по требованию.

Медицина и фармакология

Свое применение облачные технологии нашли и в медицине. Например, широкое распространение в мире получили так называемые электронные медицинские карты. Электронная медицинская карта (ЭМК) хранит все необходимые данные о пациентах в цифровом формате на защищенных удаленных серверах.

Благодаря этому облегчается обработка персональных данных пациентов, оптимизируются бизнес-процессы: все медицинские учреждения получают доступ к истории болезни человека, что избавляет последнего от необходимости заводить карты в каждой поликлинике.

По результатам опроса, проведенного компанией Accenture среди 3700 врачей восьми стран мира, 70,9% респондентов считают, что информационные технологии в медицине повышают качество проводимых клинических исследований, а 69,1% отметили повышение качества медицинского обслуживания и сокращение числа врачебных ошибок. И это похоже на правду. В больницах США, где внедрены ЭМК, на лечение пациента, увезенного на скорой, уходит [7] гораздо меньше времени.

Подобные тенденции наблюдаются и в Европе. В провинции Андалусия работает глобальная медицинская информационная система DIRAYA, построенная на инфраструктуре Oracle. К этой системе обращаются все медицинские учреждения, получая необходимую информацию о пациентах и актуальные данные о ходе лечения и назначенных лекарствах.

Кстати о лекарствах. По данным [8] исследования компании Accenture, все большее число компаний, занятых в химической промышленности, начинают адаптировать облачные технологии. В качестве примера стоит привести приложение для QSAR-моделирования Cyprotex, которое используется для автоматизации принятия решений и формирования предсказательных моделей. Его цель – создание лучших и безопасных лекарств и снижение необходимости их тестирования на животных.

Поиск количественных соотношений структура-свойство (QSAR) основан на применении методов математической статистики и машинного обучения для построения моделей, позволяющих по описанию структур химических соединений предсказывать их физические и химические свойства.

К сожалению, создание новой модели – дело ресурсоёмкое, потому химикам приходилось долгое время ожидать [9] результатов обработки. Облачные технологии революционизировали использование QSAR, сократив время генерации предсказательных моделей.

На этом все. Облачные сервисы за последние несколько лет проникли во многие сферы жизни и бизнеса, используются небольшими и крупными компаниями. В этой серии постов мы постарались рассмотреть наиболее интересные области и примеры того, как облачные технологии помогают проводить научные исследования.


Автор: ИТ-ГРАД

Источник [10]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/iaas/156747

Ссылки в тексте:

[1] Image: https://habrahabr.ru/company/it-grad/blog/304656/

[2] Matteo Bagnoli: https://www.flickr.com/photos/matteo_bagnoli/5030431525/in/photolist-8Ewh32-6Ypyk6-hyCS3-hyCLb-4YgpF6-4YkDSA-7z68DP-4YkDUS-4YkDX7-9xyJ1W-88vRYz-87EGLm-5JJyqX-87EGgo-88vRux-87EGHN-88z7n7-87EGnG-88vRzk-4hXaDB-88z7hf-88vSoK-88z6Gd-88z6Ws-88z6L3-88vRMP-88vS4v

[3] CC: https://creativecommons.org/licenses/by-sa/2.0/

[4] прошлый раз: https://habrahabr.ru/company/it-grad/blog/304652/

[5] IaaS: http://www.it-grad.ru/iaas/iaas-vmware/virtual-infrastructure/

[6] хранят: http://genomebiology.biomedcentral.com/articles/10.1186/gb-2010-11-5-207

[7] уходит: http://www.azcentral.com/arizonarepublic/business/articles/2010/08/20/20100820digital-hospital-records-more-efficient.html?nclick_check=1ELEMENT_ID=848

[8] данным: https://www.accenture.com/us-en/insight-cloud-computing-changing-game-chemical-companies

[9] ожидать: http://www.esciencecentral.co.uk/wp-content/uploads/2011/03/IEEE-e-Science-2010-final.pdf

[10] Источник: https://habrahabr.ru/post/304656/?utm_source=habrahabr&utm_medium=rss&utm_campaign=best