- PVSM.RU - https://www.pvsm.ru -

Как повысить производительность систем хранения данных в дата-центре

По информации Cisco, к 2019 году один пользователь будет генерировать [1] 1,6 ГБ данных на облачных хранилищах ежемесячно. Увеличение объема информации — главный [2] фактор роста ИТ-рынка и в то же время серьезный вызов для инфраструктуры. Поэтому в этой статье посмотрим, как поднять производительность и эффективность SSD и HDD в дата-центре.

Как повысить производительность систем хранения данных в дата-центре - 1 [3]
/ кадр из видео [4] о дата-центре Xelent, в котором размещается [5] оборудование 1cloud

Что влияет на производительность HDD и SSD в дата-центрах

Проблемы производительности, связанные с хранением, упираются [6] в размеры блоков данных вне зависимости от архитектуры СХД — будь то традиционная инфраструктура или распределенное хранилище. Например, операции с одним и тем же объемом данных при работе с блоками требуют разного количества ресурсов: запись 100 байт в один блок или несколько займет разное время.

Другой фактор — то, как система обращается к файлам и как они хранятся на диске. Процедуры определения местоположения информации приводят к задержкам обработки в случае с HDD. При этом большие данные [7], размером свыше петабайта, преобразуются в огромное количество метаданных, с которыми справится не каждая файловая система.

Также на производительности систем хранения сказываются физические ограничения технологий. Есть мнение [8], что с ростом производительности темпы развития параметров HDD не следуют закону Мура. SSD же развиваются предсказуемо: пропускная способность вместе с емкостью растет, как того ожидает индустрия.

Однако у HDD еще осталось поле для маневра — ведутся работы [9] по уменьшению дисков в размерах и увеличению плотности записи, направленные на повышение эффективности запоминающих устройств. Например, только в начале октября этого года компания WD представила [10] новую технологию микроволновой магнитной записи (MAMR), которая, по расчётам разработчиков, позволит создавать 40-терабайтные HDD.

Как повысить производительность систем хранения данных в дата-центре - 2
/ кадр из видео [4] о дата-центре Xelent, в котором размещается [5] оборудование 1cloud

Как повысить производительность систем хранения данных

Определить узкие места

Валдис Филкс (Valdis Filks), директор по исследованиям в Gartner Inc, сравнивает [11] поиск «утечки» производительности в системе хранения с поиском сокровищ. И отмечает, что для этого нужны специальные инструменты. Сегодня индустрия предлагает как встроенные системы для оценки работоспособности массивов хранения данных, так и стороннее программное обеспечение для управления ресурсами хранения (SRM) и мониторинга.

Например, компания Dell EMC предлагает [12] встроенные инструменты для управления ресурсами хранения и составления отчетов. Они позволяют сформировать статистику по емкости, конфигурации и производительности используемых массивов. Отметим, что подобные решения предоставляют [13] и IaaS-провайдеры, если речь об отслеживании производительности СХД в виртуальной инфраструктуре.

Оптимизировать данные

Повысить производительность СХД можно, если правильно скомпоновать накопители в пулы. Один из вариантов [14] — объединение дисков с низкой производительностью, которые хранят основную массу данных, и использование динамического выделения памяти и дедупликации [15].

Для выполнения этих функций существует большое количество современных решений. Дополнительно они обеспечивают защиту данных и виртуальных серверов. Одним из примеров может служить [16] решение ClearSky Data, которое устраняет дубликаты данных и предлагает возможности резервного копирования и восстановления после катастрофы.

Идея проекта заключается в следующем: кеш с бизнес-критической информацией хранится на площадке клиента, «теплые» данные помещаются в локальное облако, а «холодные» выносятся во внешнее облако. Компания разработала программное обеспечение, которое автоматически управляет данными, перемещая их между точками хранения. Алгоритмы анализируют интенсивность использования информации и требования заказчика.

Еще один проект [17] — это стартап Datrium. Идея разработчиков заключается в том, что дедупликация выполняется дважды: на локальной флеш-памяти до пересылки на устройство долгосрочного хранения, и после него. О других интеллектуальных системах дедупликации и резервного копирования вы можете почитать [18] в одном из наших материалов.

Оптимизировать кеш

Если объем данных, используемый системой, слишком велик для кеша, производительность может существенно снизиться. Решить проблему помогает [14] виртуализация СХД. Виртуализация точек монтирования, в которых система хранения данных связывается с сервером и ОС, позволяет задействовать DRAM для создания общего кеша.

Впоследствии его можно использовать с целью ускорения работы приложений и выполнения буферизации. Специалисты из аналитической компании StorageSwiss говорят [19], что такой подход хорошо показывает себя при работе с системами обработки транзакций в реальном времени.

Оптимизировать работу сети

Модернизация сети помогает в тех случаях, когда производительность страдает от недостатков на уровне адаптера главной шины, сетевого коммутатора или кабельной инфраструктуры. Кабельные соединения часто упускаются [20] из виду как фактор снижения эффективности хранения данных.

Еще одна причина — неэффективное управление [21] трафиком. Если сеть обладает ограниченной пропускной способностью, то часть канала можно отвести под критически-важные сервисы, «поджав» работу второстепенных (скажем, электронной почты).

Для повышения качества управления трафиком, специалисты консалтинговой группы Ashton Metzler & Associates Inc. советуют мониторить сеть и готовить отчеты, чтобы своевременно изменять модель распределения данных.

Как отмечают [22] сотрудники Viavi Solutions, один из эффективных способов трафик-менеджмента — это иерархическая система качества обслуживания (H-QoS). Она объединяет в себе сетевые политики и политики фильтрации. H-QoS снижает латентность, не требуя повышения пропускной способности сети.

Использовать особенности устройств хранения

Хотя SSD и HDD выполняют одну и ту же функцию, они основаны на разных технологиях. Поэтому к этим устройствам требуется различный подход. Например, в случае с SSD фрагментация никак не сказывается на производительности. Это означает, что дефрагментация не дает преимуществ в вопросе оптимизации. Поэтому команда PC Magazine Labs отмечает [23], что иногда бывает полезно отключить эту функцию для твердотельных накопителей.

Также отметим, что внутренняя реализация ряда операций, например, удаления файлов, в SSD и HDD отличается. А выполнение некоторых стандартных функций на SSD (например, форматирования) даже приводит [24] к ухудшению их производительности. И чтобы противостоять этому эффекту, стоит использовать команду TRIM, которая уменьшает [25] влияние «сборки мусора [26]» на SSD-устройстве.

Бывают ситуации, когда TRIM не поддерживается ОС. Для таких случаев были разработаны специальные инструменты, которые дают возможность посылать команду «вручную». Эти утилиты формируют список свободных блоков и передают его диску в виде последовательности TRIM-команд. При этом есть как универсальные инструменты (например, hdparm [27]), так и специализированное программное обеспечение для дисков отдельных производителей (Intel SSD Toolbox [28]).

P.S. Вот еще несколько статей об аппаратных решениях из нашего блога:

Автор: 1cloud

Источник [33]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/iaas/268636

Ссылки в тексте:

[1] будет генерировать: http://www.datacenterknowledge.com/archives/2016/05/02/google-wants-rethink-data-center-storage

[2] главный: http://www.businessvision.com/us/articles/technology/cloud-storage-market

[3] Image: https://habrahabr.ru/company/1cloud/blog/342718/

[4] видео: https://www.youtube.com/watch?v=ljFvodf4PAY

[5] размещается: https://1cloud.ru/infrastructure/datacenter-saint-petersburg

[6] упираются: http://www.datacenterknowledge.com/archives/2016/05/04/impact-block-sizes-data-center

[7] большие данные: http://www.datacenterknowledge.com/archives/2013/09/05/big-data-what-it-means-for-data-center-infrastructure

[8] мнение: https://itblog.sandisk.com/does-storage-break-moores-law/

[9] работы: http://www.computerweekly.com/feature/Hard-drive-capacity-emphasized-over-performancefor-future-enterprise-hard-drives

[10] представила: http://www.ixbt.com/news/2017/10/13/wd-mamr-hdd-40.html

[11] сравнивает: http://searchstorage.techtarget.com/report/Troubleshooting-and-identifying-data-storage-performance-bottlenecks

[12] предлагает: https://www.dellemc.com/ru-ru/storage/storage-monitoring-reporting.htm

[13] предоставляют: https://1cloud.ru/infrastructure/panel-upravleniya

[14] вариантов: https://habrahabr.ru/company/1cloud/blog/301546/

[15] дедупликации: http://searchstorage.techtarget.com/tip/Understanding-data-deduplication-for-primary-storage

[16] служить: https://yourdailytech.com/storage-architecture/storage-clearsky-data-is-ranking-high-in-storage/

[17] проект: http://searchstorage.techtarget.com/feature/Twelve-data-storage-company-startups-to-watch-in-2016

[18] почитать: https://habrahabr.ru/company/1cloud/blog/322764/

[19] говорят: https://storageswiss.com/2014/05/15/why-you-should-consider-server-caching-for-virtualization/

[20] упускаются: https://www.brocade.com/content/dam/common/documents/content-types/product-design-guide/cabling-best-practices-ga-bp-036-02.pdf

[21] управление: http://www.ashtonmetzler.com/BW_Optimization.pdf

[22] отмечают: http://www.viavisolutions.com/sites/default/files/technical-library-items/optimization_wp_cpo_tm_ae.pdf

[23] отмечает: https://www.pcmag.com/article2/0,2817,2404258,00.asp

[24] приводит: https://www.anandtech.com/show/2738

[25] уменьшает: http://www.apartmenttherapy.com/trim-that-drive-why-trim-matte-142681

[26] сборки мусора: https://en.wikipedia.org/wiki/Garbage_collection_(computer_science)

[27] hdparm: https://ru.wikipedia.org/wiki/Hdparm

[28] Intel SSD Toolbox: https://downloadcenter.intel.com/download/27130/Intel-Solid-State-Drive-Toolbox

[29] Облачное хранилище данных: руководство для новичков: https://1cloud.ru/blog/oblachnoe-hranilische

[30] Виртуальный или физический сервер: сравниваем расходы на инфраструктуру: https://1cloud.ru/blog/sravnenie-stoimosti-tipov-serverov

[31] Технологии охлаждения дата-центров: популярные и необычные решения: https://1cloud.ru/blog/ohlajdenie-data-center

[32] Терминальный сервер: что это и для чего нужен: https://1cloud.ru/blog/terminalnyj-server

[33] Источник: https://habrahabr.ru/post/342718/?utm_source=habrahabr&utm_medium=rss&utm_campaign=best