- PVSM.RU - https://www.pvsm.ru -

HP BURA (HP BackUp, Recovery and Archiving) — предложение HP для организации системы резервного копирования и архивирования данных

HP BURA (HP BackUp, Recovery and Archiving) — предложение HP для организации системы резервного копирования и архивирования данных - 1

В этом обзоре описан подход Hewlett-Packard по организации системы управления данными и их защите.

Резервное копирование и восстановление

Во многих современных организациях с ростом объема данных, а также требований к доступности информационных бизнес-систем возрастают требования к системам обеспечения целостности, защиты данных и их быстрого восстановления в случае чрезвычайной ситуации. Поскольку в абсолютном большинстве случаев информационные системы имеют неодинаковую важность и критичность для бизнеса, организации разрабатывают классификаторы подлежащих защите систем с указанием требований для каждого класса (по уровням критичности для бизнеса).

К основным метрикам систем резервного копирования данных относятся:
— RPO (Recovery Point Objective) – «точка восстановления», момент актуальности, на который та или иная система должна быть восстановлена.
— RTO (Recovery Time Objective) – время, за которое система должна быть полностью восстановлена.
— Окно резервного копирования – временной период, в течение которого должно быть выполнено резервное копирование системы.
— Retention Policy – политика и срок хранения резервных копий (дневных, недельных, месячных, годовых) системы.

В организациях с территориально распределёнными ИТ-инфраструктурами к вышеперечисленным требованиям добавляются особенности защиты удалённых офисов и филиалов: политика хранения локальных резервных копий, пропускная способность канала связи, задержки и др.

В зависимости от вышеперечисленных требований и особенностей, а также от объема защищаемых данных, могут применяться различные технологии, позволяющие выполнить эти требования. Классическое оборудование систем резервного копирования уровня предприятия, такое как дисковые массивы и ленточные библиотеки, имеет в своём составе технологии, помогающие частично решить эту задачу – аппаратные мгновенные снимки и клоны данных, многопоточное копирование, мультиплексирование, LAN-free backup.

Однако, зачастую этого оказывается недостаточно – с учётом современных темпов роста данных обеспечить их эффективную и при этом экономичную защиту представляется нетривиальной задачей. Сравнительно недавно многие производители систем резервного копирования стали применять различные технологии для минимизации копирования повторяющейся информации (технологии дедупликации). Проблема дублирующихся данных особенно актуальна для резервного копирования, т.к. в соответствии с регламентами организаций очень часто приходится копировать и хранить от нескольких единиц до нескольких десятков копий одних и тех же данных.

Дедупликация

Дедупликация является технологией, позволяющих решить сразу несколько задач, связанных с резервным копированием и восстановлением. Она позволяет:
— существенно (до десятков раз) сократить время создания полной резервной копии данных;
— сократить время восстановления из резервной копии;
— существенно уменьшить расходы на хранение резервных копий за счёт хранения только унимальных блоков данных.
Подход компании Hewlett-Packard к реализации технологии дедупликации в своих решениях является уникальным, т.к. только у HP в рамках одного интегрированного решения можно сочетать возможности дедупликации на различных участках ИТ-инфраструктуры, а также использовать различные хранилища дедуплицированных блоков (как аппаратные, так и программные).

Как работает дедупликация

Процесс дедупликации в решениях Hewlett--Packard можно разбить на ряд последовательных действий.

HP BURA (HP BackUp, Recovery and Archiving) — предложение HP для организации системы резервного копирования и архивирования данных - 2

Перед дедупликацией программный компонент HP Data Protector Media Agent передаёт поток бэкапируемых данных в специальный буфер. Движок дедупликации осуществляет выборку данных из этого буфера и производит следующие действия:
— разбивает данные на блоки переменной длины (средняя длина блока равна 4 KB);
— вычисляет хэш-суммы блоков;
— определяет повторяющиеся блоки путём сравнения их хэш-сумм;
— компрессирует уникальные блоки для экономии места при хранении;
— сортирует блоки для более оптимальной записи их в хранилище блоков.

После этого только уникальные данные попадают в хранилище блоков HP StoreOnce.
Эффективность дедупликации выражается в виде коэффициента, равного отношению объема подлежащих копированию данных (до дедупликации) к реально скопированным дедуплицированным данным. Ключевыми факторами, влияющими на эффективность дедупликации, являются:
— Регламент резервного копирования. Чем больше полных бэкапов и меньше инкрементных, тем выше эффективность дедупликации.
— Срок хранения резервных копий. Чем выше срок хранения, тем больше вероятность нахождения там ранее скопированных блоков и соответственно выше эффективность дедупликации.
— Процент относительных изменений данных между сессиями резервного копирования. Чем больше этих изменений, тем меньше вероятность нахождения в хранилище ранее скопированных блоков, тем соответственно меньше коэффициент дедупликации.
— Размер файлов. Инкрементные копии файлов размером, сопоставимым с размером блоков дедупликации (~4 KB), снижают эффективность дедупликации для этих файлов.

Федеративная дедупликация HP StoreOnce

Дедупликацию данных в решениях Hewlett-Packard можно осуществлять на следующих участках ИТ-инфраструктуры:
— на серверах защищаемых приложений. В этом случае данные с защищаемых серверов поступают уже в дедуплицированном виде. Данный вариант идеально подойдёт для защиты небольших удалённых филиалов с тонкими каналами связи. Однако необходимо учесть, что дедупликация – длостаточно ресурсоёмкий процесс, и нагрузка на серверы приложений может значительно увеличиться.

HP BURA (HP BackUp, Recovery and Archiving) — предложение HP для организации системы резервного копирования и архивирования данных - 3

— на сервере резервного копирования. В этом случае данные с клиентов попадают на выделенный сервер [1] «как есть» (без дедупликации), дедуплицируются на этом сервере, а затем их можно передать в центральное хранилище HP StoreOnce. Данный вариант подойдёт для защиты крупных филиалов (когда нет необходимости экономить трафик с клиентов и целесообразно выделение сервера для дедупликации), когда дополнительная нагрузка на защищаемый сервер нежелательна, а также когда версия и/или разрядность ОС сервера приложения не поддерживается движком дедупликации.

HP BURA (HP BackUp, Recovery and Archiving) — предложение HP для организации системы резервного копирования и архивирования данных - 4

— на специализированных дисковых библиотеках — устройствах хранения резервных копий. В этом случае все компоненты для дедупликации встроены в устройства HP StoreOnce, и дедупликация выполняется за счёт аппаратных ресурсов HP StoreOnce. Достоинством данного варианта является его относительная простота и скорость внедрения, а также минимизация вносимых изменений в текущую ИТ-инфраструктуру.
В качестве хранилища уникальных блоков можно использовать не только аппаратные дисковые библиотеки HP StoreOnce, но и виртуальные устройства HP StoreOnce Virtual Storage Appliance (VSA), а также программные хранилища HP Data Protector Software Stores.

Для эффективной защиты распределённых инфраструктур в решениях Hewlett-Packard есть возможность совмещать вышеперечисленные виды дедупликации в зависимости от требований конкретной среды. Кроме того, для обеспечения катастрофоустойчивости можно организовать репликацию данных между несколькими хранилищами HP StoreOnce, расположенными на разных площадках. В случае наступления чрезвычайной ситуации данные можно будет быстро восстановить на резервной площадке. Важно отметить, что между площадками будут пересылаться только изменённые блоки данных. Во всех перечисленных сценариях управление и мониторинг процессов резервного копирования и восстановления данных можно осуществлять из единого интерфейса HP Data Protector.

HP BURA (HP BackUp, Recovery and Archiving) — предложение HP для организации системы резервного копирования и архивирования данных - 5

Архивирование

Согласно результатам проведённого в 2013 г. исследования компании Enterprise Strategy Group (ESG), одним из наиболее значимых трендов, влияющих на архитектуру и инфраструктуру современных ИТ, является экспоненциальный рост объема хранимых данных. Его влияние распространяется как на подсистему хранения, так и на серверы приложений. При этом бизнес-ценность хранимых данных для организации неодинакова: по статистике, около 70-80% объема приходится на устаревшую, редко востребованную или дублирующуюся информацию (например, полученные/отправленные несколько месяцев или лет назад электронные сообщения, старые записи в базах данных, многочисленные копии файлов). Следовательно, и требования SLA к производительности, частоте резервного копирования, времени восстановления и т.д. для различной информации должны быть неодинаковыми.

HP BURA (HP BackUp, Recovery and Archiving) — предложение HP для организации системы резервного копирования и архивирования данных - 6

При этом вся эта информация время от времени бывает необходима, например для целей построения аналитических отчётов или трендов, а также в случае проведения аудитов или расследований инцидентов информационной безопасности.

Одним из наиболее эффективных подходов, применяемых для оптимизации хранения информации в средних и крупных организациях, является архивирование. В отличие от бэкапа, при архивировании, как правило, не создаётся копия продуктивных данных.

Архивируемые объекты переносятся в недорогое хранилище, при этом они индексируются и могут быть быстро найдены и восстановлены из архива в случае необходимости. Кроме того, на продуктивных серверах (таких как почтовые или файловые серверы) могут быть установлены специальные «заглушки» — ссылки на заархивированные объекты, что позволяет конечным пользователям быстро перейти к соответствующему объекту из привычного интерфейса.

Архивирование также может быть полезным с точки зрения оптимизации процессов резервного копирования. Настроив архивирование одновременно в несколько репозиториев, можно получить отказоустойчивый архив. При этом за счёт освобождения продуктивных серверов от обработки большей части данных улучшатся показатели производительности приложений, а время резервного копирования и восстановления таких серверов существенно сократится. А это, в свою очередь, даёт возможность внедрить гибкие политики резервного копирования для различных классов данных: часто используемые, критичные данные копируются чаще и с использованием аппаратных снимков на дисковых массивах, устаревшие данные копируются реже и стандартным способом.

HP BURA (HP BackUp, Recovery and Archiving) — предложение HP для организации системы резервного копирования и архивирования данных - 7

Компания Hewlett-Packard имеет в своём портфеле широкий набор средств для архивирования как структурированных (базы данных, структурированные файлы), так и неструктурированных данных (почтовые объекты, файлы, объекты MS SharePoint, мгновенные сообщения и др.). Для обеспечения быстрого поиска объектов в архиве используется аналитический движок HP Intelligent Data Operating Layer (IDOL), который, благодаря своей масштабируемой архитектуре, позволяет организовать индексирование и аналитическую поисковую обработку практически неограниченного массива данных.


Дистрибуция решений НР в Украине [2], Грузии [3]и Таджикистане [4].

Учебные курсы по НР [5] в УЦ МУК (Киев)
20-21 апреля, Cloud Computing Foundation (EXIN) [6]
1-3 июня, Managing 3PAR Disk Arrays [7]
4-5 июня, Мanaging HP 3PAR Disk Arrays: Replication and Performance [8]

Автор: Muk

Источник [9]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/oblachny-e-vy-chisleniya/89127

Ссылки в тексте:

[1] выделенный сервер: https://www.reg.ru/?rlink=reflink-717

[2] Украине: http://muk.ua/company/vendors/hp/

[3] Грузии : http://muk.ua/business/GE/ru.php

[4] Таджикистане: http://muk.ua/business/TJ/ru.php

[5] Учебные курсы по НР: http://training.muk.ua/courses/hewlett_packard/

[6] Cloud Computing Foundation (EXIN): http://training.muk.ua/courses/obuchenie-spetsialistov-po-serveram-hp-proliant-bladesystem-/6653/

[7] Managing 3PAR Disk Arrays: http://training.muk.ua/courses/hp-storageworks-msa/317/

[8] Мanaging HP 3PAR Disk Arrays: Replication and Performance: http://training.muk.ua/courses/hp-storageworks-msa/1993/

[9] Источник: http://habrahabr.ru/post/255843/