Надежность и долговечность играют существенно разные роли в сохранении целостности данных. Надежность относится к аптайму системы, тогда как долговечность относится к долговременной защите данных. Из-за своей недостаточной долговечности RAID-массивы плохо подходят для архивации. И вот почему.

В сфере хранения данных наметилась устойчивая тенденция к выбору универсального подхода. Никто не хочет обременять себя управлением двумя системами, если одной будет достаточно. Но нужно точно понимать, что именно необходимо в случае той или иной практической задачи, и позаботиться о достойной реализации главных условий ее успешного решения.

Именно так обстоят дела с RAID-массивами и архивацией. Еще лет пять назад у вас было два варианта создания корпоративного архива: ленточная библиотека или RAID-массивы. Ленточные библиотеки до сих пор представляют собой дешевый способ архивации огромных объемов данных, что же касается RAID-массивов, особенно полностью списанных с баланса (амортизированных), то предприятия пытаются на них сэкономить, найдя им новое применение.

Но ведь в современных дисковых архивах по вполне доступной начальной цене можно получить такие преимущества, как быстрое извлечение данных и непревзойденная долговечность. Так как предназначением архива является сохранение данных, крайне важно понимать разницу между надежностью и долговечностью.

Надежность

Надежность данных в СХД обеспечивается за счет аппаратного резервирования, а долговечность достигается с помощью резервирования данных. Рассмотрим каждый из этих терминов по отдельности.

В RAID-массивы обычно включаются два и более следующих важных аппаратных узлов: контроллеры, система ввода-вывода, диски. При этом резервирование данных организовано таким образом, чтобы избежать потери данных при однократном (RAID 5) или двукратном (RAID 6) сбое в работе дисков. Несмотря на то, что RAID-массивы в теории должны обеспечивать степень доступа, близкую к 100% (99,9999%), зачастую им это не удается — и это ставит под угрозу ваши данные.

Почему RAID-массивы не справляются с задачей

Основная проблема с RAID-массивами (о которой не подозревали ранние проектировщики RAID) заключается в том, что неверным оказалось само центральное предположение, на котором строилась вся модель. Это предположение — что отказы дисков случаются независимо друг от друга — означает, что реальность пользователей в корне отличалась от того, что им пытались продать вендоры.

Выяснилось, что при отказе одного диска намного повышается вероятность отказа еще одного. Весь изначальный план технического проектирования и маркетинга RAID основывался на предположении, что сбои в работе дисков не связаны между собой, так что из среднего времени наработки на отказ дисков конкретного вендора можно было вычислить среднее время работы до потери данных, которое стремилось к бесконечности. Красивая теория. Жалко, что она не сработала!

Современный подход

В сегодняшних системах долговечной архивации используются высоконадежные хранилища на основе объектов (объектные хранилища), которые позволяют добиться гораздо более высокой отказоустойчивости — до 99,9999999999999% (и выше!) — и обеспечить сохранность данных. Это означает, что при хранении одного квадриллиона (1015) объектов считываться не будет только один.

Каким образом удается достичь таких невероятных результатов с долговечными архивами? Как именно данные кодируются и располагаются в хранилище?

Сравнительный анализ схем расположения данных в RAID-массивах и долговечных архивах

Данные четности — вот что позволяет RAID-массивам и объектным хранилищам восстанавливать утерянные данные. Но при этом в RAID-массивах и долговечных архивах четность используется совершенно по-разному.

В RAID-системах данные и блоки четности размещены в фиксированной группе дисков, обычно расположенных на одной полке. В базовой схеме расположения RAID 6 могут присутствовать четыре диска данных и два диска четности, обеспечивающих защиту лишь от двух отказов дисков.

В системах долговечного архивирования также используется четность для защиты данных, но делается это с помощью алгоритмов, которые еще не существовали на момент введения RAID в эксплуатацию в конце 1980-х. Эти современные, усовершенствованные коды избыточности (erasure codes), часто называемые кодами с нефиксированной скоростью (rateless), или фонтанными кодами, могут предложить более высокую избыточность и эффективность в рамках идеального решения для экономичной, длительной защиты данных.

Полезные данные и данные четности встраиваются в объекты, в отличие от данных в RAID-массивах. Объекты разбиваются на фрагменты и распределяются по доступному дисковому пространству. Если это пространство разнесено географически, такой архив может пережить даже потерю целого дата-центра.

Ни один RAID-массив не может гарантировать защиту данных на таком же уровне. К тому же объектное хранилище с единым пространством имен можно физически разместить как на одном сервере, так и на стойке, в пределах дата-центра или даже в нескольких удаленных регионах одновременно.

Мое видение хранения данных

Когда речь заходит об архивации данных, ленточные библиотеки уже не выбирают автоматом, как раньше, хотя они все еще находят свое применение. Оснащенные технологиями, которые сперва были опробованы на гипермасштабируемых дата-центрах, современные системы архивации позволяют предприятиям архивировать свои данные по цене ниже той, что предлагают публичные облака, и при этом гарантируют бόльшую степень сохранности данных, чем в публичных облаках.

Инженерам, занимающимся проектированием и созданием архитектуры дата-центров, имеет смысл оценить ограничения RAID-массивов в плане применения их в качестве носителей архивов. Растут темпы перемен в технологиях хранения данных, и ИТ-профессионалы должны проявить достаточно мудрости, чтобы приспособиться к этим переменам и соперничать с теми, кто может предложить свои услуги со стороны.