2017/10/20 12:11:46

Huawei гарантирует сокращение объемов данных 3:1. Результаты тестов значительно превзошли ожидания

Рост бизнеса сопровождается быстрым увеличением объемов данных. По прогнозу Gartner к 2021 году объемы данных корпоративных ЦОД увеличатся в 10 раз. С каждым днем все заметнее дефицит пространства для хранения, усложнение управления данными, рост инвестиций в устройства хранения и энергопотребления. Очевидна необходимость сокращения объемов данных для экономии затрат и оптимального использования пространства.

Эра «All-flash» уже наступила. Революция в технологиях хранения и инновации в области программного и аппаратного обеспечения добавляют интенсивности и эффективности процессам, происходящим в ЦОД. Ключевые флэш-технологии — дедупликация и сжатие данных — становятся необходимы все большему числу предприятий. Причина: снижение совокупной стоимости владения для клиента за счет сокращения объемов избыточных данных, повышение эффективности передачи, обработки и хранения на всем цикле.

Почему дедупликация и сжатие так важны?

Во-первых, эти функции обеспечивают сокращение объемов данных, необходимое для снижения требований к физическому пространству хранения и, как следствие, экономию инвестиций и затрат на обслуживание при одновременном уменьшении нагрузки на окружающую среду.

Во-вторых, эти функции помогают увеличить срок службы SSD-дисков. SSD имеют ограниченную выносливость при записи. Дедупликация и сжатие уменьшают количество записей и объем записанных данных, продлевая срок службы и защищая инвестиции клиентов.

Крупные производители разработали собственные функции сокращения данных. Однако не все предложения одинаковы по гранулярности и алгоритмам, что означает их различную эффективность. Известные поставщики заявляют коэффициенты сокращения данных от 2:1 до 5:1 в случае БД и серверной виртуализации, и даже более высокие коэффициенты — в сценариях VDI. Например, компания Pure Storage указывает о среднем коэффициенте дедупликации и сжатия по всей инсталлированной базе 5:1, с учетом thin provisioning 10:1. Коэффициент публикуется на официальном сайте Pure и обновляется в режиме, близком к реальному времени.[1] Заявленный коэффициент сокращения данных в HPE 3PAR — 4:1.

Система нового поколения Huawei OceanStor Dorado V3, полностью на базе флэш-памяти, имеет функции дедупликации на лету и сжатия (SmartDedupe & SmartCompression), гарантирующие сокращение объема данных минимум 3:1.Дмитрий Бородачев, DатаРу Облако: Наше преимущество — мультивендорная модель предоставления облачных услуг

Коэффициент 3:1 был получен не в идеальных условиях, а в ходе реального тестирования.

В проведенном тестировании были использованы популярные сценарии развертывания БД Oracle для проверки функций дедупликации и сжатия на оборудовании OceanStor Dorado V3 Huawei.

Тестовая сеть включает:

Четыре комплекта серверов Huawei RH2288, одну СХД Huawei OceanStor Dorado6000 V3, два коммутатора Fiber Channel 16G для создания дублированной сети хранения данных и среды Oracle RAC с двумя узлами, для тестирования.

Тестовая сеть
Программное обеспечение
Использованная тестовая модель


После завершения конфигурирования был проведен тест и получены следующие результаты:

Сценарий 1: базы данных были заполнены 1 терабайтом данных с помощью инструмента SLOB, после чего отслеживалась их производительность. Результаты приведены ниже:


Был достигнут впечатляющий коэффициент сокращения данных 7,6:1, что означает экономию 87% пространства. Эти цифры намного превышают опубликованный Huawei показатель 3:1, который скорее является гарантированным нижним уровнем.

В реальных условиях данные активно меняются, никогда не бывают статичными. Например, на сайтах с блогами пользователи их публикуют, изменяют, отвечают на комментарии, обновляют свои материалы и выполняют множество других операций, связанных с обновлением данных в базах. Изменение данных также влияет на коэффициент их сокращения. Другими словами, он сам постоянно изменяется.

Для повышения точности и достоверности тестовых данных, тестирование было продолжено с основными параметрами сценария 1, при этом было добавлено несколько динамических переменных.

Сценарий 2: с помощью инструмента SLOB были настроены параметры тестирования нагрузки в файле конфигурации slob.conf и запущен скрипт runit.sh, который работал в течение 100 непрерывных дней тестирования нагрузки с целью имитации изменений данных, происходящих в действующих сетях. В течение всего длительного тестирования нагрузки отслеживался коэффициент сжатия данных.

Параметры конфигурации, используемые в сценарии 2:

Через 100 дней непрерывной записи и обновлений был получен коэффициент сокращения объема данных, равный 5,2:1.

Гарантированный Huawei коэффициент сокращения данных 3:1 по всем показателям является довольно консервативным, учитывая результаты первого теста, в котором соотношение 7,6:1 было достигнуто при сбросе данных в базу Oracle, и результаты второго теста, при котором проводилось постоянное обновление данных во время нагрузочного тестирования.

В простых числах: если в корпоративной БД Oracle имеется 5,2 ТБ файлов с данными, то при динамических условиях эти файлы будут занимать всего 1 ТБ хранилища. Функции дедупликации и сжатия платформы Huawei OceanStor позволяют использовать пространство в пять раз эффективнее, это важный аспект снижения ТСО для предприятия.

228