- PVSM.RU - https://www.pvsm.ru -

IBM PureData для Hadoop: чем эта система может мне помочь?

IBM PureData для Hadoop: чем эта система может мне помочь?Сегодня в компаниях информация выстраивается и хранится, как правило, несколькими способами и на нескольких платформах. Данные существуют в неструктурированном, неоптимизированном виде, что не позволяет извлекать из них информацию, необходимую для принятия стратегически важных решений. Роль Больших данных в этом сценарии заключается в возможности собирать такую информацию из различных входных данных, структурировать ее и выдавать данные для использования при анализе, при принятии решений и при работе со средствами предиктивной аналитики. Новейшая из систем IBM PureSystems [1] объединяет в себе концепцию «Больших данных» и решение Apache Hadoop, исходя именно из таких задач.

Библиотека Apache Hadoop производит распределенную обработку больших наборов данных. Для этого используются простые модели программирования под Hadoop. Основное назначение Hadoop – обеспечить управление процессами обработки данных на множестве серверов и их синхронизацию, но только за счет программного обеспечения, убрав управление на кластерном, аппаратном уровне.

Система IBM PureData для Hadoop [2] разрабатывалась с учетом такого подхода в плане аппаратного и программного обеспечения, подготовленного для облачной архитектуры. Все преимущества и особенности Hadoop объединяются с поддержкой и простым администрированием, которые может предложить PureData.

IBM PureData для Hadoop: чем эта система может мне помочь?Для обеспечения интеграции Hadoop и данной системы были объединены IBM InfoSphere BigInsights [3] и серверы IBM System x [4]; таким образом, программное обеспечение для обработки больших наборов данных интегрировано в простом с точки зрения администрирования комплексе, а обновления производятся компанией IBM для всего вычислительного комплекса. Связываться с какими-либо сторонними службами поддержки аппаратных средств и ПО Hadoop не нужно.

Если необходимо выстроить среду с высокой готовностью, интегрированную и оптимизированную под повышение производительности, то взяв бесплатно распространяемую версию Hadoop, вы столкнетесь с множеством трудностей. В системе PureData для Hadoop вся эта функциональность уже есть, она также полностью интегрирована с другими аппаратными решениями PureSystems, которые вы возможно уже используете. Это важные моменты, которые необходимо учитывать, выбирая между платным и бесплатным решением. Было много примеров внедрения, где использовались сложные инструменты с открытым кодом, требовавшие огромных навыков написания собственного дополнительного программного обеспечения для достижения требуемой функциональности. В итоге, когда разработчики переходили на другие проекты или в другие компании, возникали проблемы. Может показаться, что такое коммерческое предложение, как PureData для Hadoop, – альтернатива дорогая, но в долгосрочной перспективе вы сможете сэкономить время и деньги на обновлениях, поддержке и интеграции с уже имеющимися системами.

Источник: PureSystems blog [5].

Автор: ibm

Источник [6]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/ibm/50289

Ссылки в тексте:

[1] Новейшая из систем IBM PureSystems: http://www.ibm.com/ibm/puresystems/ru/ru/pf_puredata.html

[2] IBM PureData для Hadoop: http://www.ibm.com/ibm/puresystems/ru/ru/pd_hadoop.html

[3] IBM InfoSphere BigInsights: http://www-03.ibm.com/software/products/ru/infobigi

[4] IBM System x: http://www-03.ibm.com/systems/ru/x/

[5] PureSystems blog: http://expertintegratedsystemsblog.com/2013/11/ibm-puredata-system-hadoop-what-can-it-do-for-me/

[6] Источник: http://habrahabr.ru/post/205334/