Новая технология посягает на доминирование магнитной ленты в качестве архивного носителя
Магнитная лента на протяжении десятилетий была и остается основным носителем архивной информации в крупных компаниях. Несколько раз на протяжении её истории поднимался вопрос об актуальности ленты и перспективах её дальнейшего развития, но такие факторы, как дешевизна, отлаженность и высокое проникновение технологии обеспечивали ленте дальнейший прогресс.
Схема циркуляции информации в пределах компании, использующей D2D-хранилище с функциями виртуальной ленточной библиотеки |
Однако, со всё возрастающими требованиями к повышению степени готовности ИТ-инфраструктуры, обнаружил себя существенный недостаток магнитной ленты — время, затрачиваемое на архивацию и восстановление. В условиях современной действительности этот параметр вносит необходимость пересмотра и корректив устоявшихся схем автоматизации архивирования.
Традиционно предпочтение в выборе носителя отдавался ленте потому, что этот носитель и по сей день является рекордсменом в себестоимости хранения 1 ГБ информации. К тому же очень существенное влияние на “долгожительность” ленты оказывает уже существующая развитая аппаратная инфраструктура архивирования данных. Но традиционная схема восстановления информации с ленты подразумевает необходимость затраты нескольких часов на эту процедуру, а если данные хранятся на географически удаленном объекте — до суток и больше. Учитывая этот фактор, высокоподвижные компании с непрерывным циклом обработки информации, несмотря на ценовую привлекательность ленты, все чаще обращают внимание на альтернативные методы архивирования. Наиболее популярной в последнее время технологией альтернативного архивирования становится Disk-to-Disk (D2D). Ее технологические отличия и преимущества позволяют преодолеть ограничения, накладываемые традиционной лентой.
NetApp VTL600 может создавать VTL-устройства, которые будут доступны существующим пакетам ПО архивирования. Объем памяти всей системы составляет от 84 до 168 ГБ |
Внедрение D2D-методов архивации, в свою очередь, также несет ряд технологических затруднений, препятствующих массовому распространению этого метода архивирования. В первую очередь речь идет об уже отработанных годами и полностью автоматизированных на крупных предприятиях процедурах архивирования, которые оптимизированы под специфическое использование ленточных носителей. Многие компании уже инвестировали немалые средства в недешевое ПО для обеспечения автоматизированного архивирования. К тому же дисковый массив невозможно, в буквальном смысле, вынести из стойки, как это делается с лентами для обеспечения географической катастрофоустойчивости. Поэтому для успешной интеграции систем D2D в уже существующую ИТ-инфраструктуру требовалась промежуточная программно-аппаратная прослойка, которой стала технология Virtual Tape Library (VTL). ПО, выполняющее функции VTL, транслирует типичные команды управления ленточными накопителями в аналогичные команды для дисковых массивов. Таким образом, для компании, которая использовала физические ленточные носители для архивации, не требуется “перекраивать” заново ИТ-инфраструктуру, только добавить новые D2D-компоненты. С помощью ПО VTL новые D2D-системы будут “выглядеть в глазах” приложений для автоматизированной архивации как обычные ленточные системы. Еще одно преимущество внедрения D2D систем заключается в том, что не требуется повторное обучение персонала. Поскольку работа с виртуальными лентами не отличаются от работы с реальными физическими, ИТ-персонал, отвечающий за архивацию и восстановление данных, может продолжать работать с привычными программными средствами.
Data Domain DD460 |
Схема организации автоматизированного архивирования данных с помощью D2D не сильно отличается от использования только лишь ленточных архивов. В центре топологии размещается сервер архивирования, который централизованно управляет всем процессом, принимает запросы от рабочих серверов и отсылает их в виде очередей записи на физические и виртуальные ленты. В качестве рабочих серверов могут выступать серверы приложений и баз данных, причем они могут быть разнородными по характеру используемых операционных систем и прикладных программ. Сервер архивирования получает задания на архивацию согласно автоматизированному расписанию от рабочих серверов и записывает данные на VTL. Обычно на VTL хранится информация одного-двух последних месяцев, так как именно “свежие” данные требуется восстанавливать чаще всего. Поскольку VTL физически хранят информацию на дисках, то процедуры архивирования и восстановления не требуют того объема времени, как реальные ленточные библиотеки — все эти процедуры могут выполняться в режиме “на лету”, в чем и состоит их основное преимущество. С этой топологией можно совместить систему управления жизненным циклом информации (information lifecycle management — ILM), которая, согласно определенным политикам, будет определять степень актуальности и “устаревания” информации. По мере потери данными своей актуальности во времени, содержимое виртуальной библиотеки можно перенести на физические ленты в стандартных ленточных библиотеках, освободив более быстрое дисковое пространство для более свежих данных. Таким образом, выстраивается наиболее оптимальный принцип циркуляции информации в пределах крупной компании, в котором сочетаются возможность восстановления наиболее актуальной информации с минимальными задержками, отсутствие необходимости в полной реконструкции существующей ИТ-инфраструктуры и использование относительно дешевых ленточных библиотек для архивного хранения данных.
Технические характеристики различных VTL-решений |
Удобство и совместимость VTL-технологии стали теми преимуществами, благодаря которым производители систем хранения смогли в короткий срок предложить рынку множество собственных решений. Эти решения позволяют создавать виртуальные VTL-устройства, легко распознаваемые существующими пакетами ПО для резервного копирования, и использовать их для заданий по архивированию. После составления таких заданий резервные копии распределяются по виртуальным “ленточным картриджам”, что обеспечивает последующий доступ к архивам при помощи ПО управления ленточными носителями. Наиболее интересные с технической точки зрения решения для VTL-архивирования представили компании Network Appliances, Data Domain и FalconStor — известные разработчики новых технологий в области хранения и обработки данных. Одним из таких устройств является семейство дисковых хранилищ DD400 компании Data Domain. Главной отличительной характеристикой, на которой акцентирует внимание компания-производитель, является возможность снижения объема записываемых данных. Это достигается несколькими способами. Первый из них — принцип дифференциальной записи, который предусматривает запись только тех фрагментов данных, которые изменились по сравнению с предыдущим записанным состоянием. Второй метод — интуитивная аппаратная компрессия данных, которая в сочетании с дифференциальной записью позволяет добиться уменьшения объемов передаваемой и хранимой информации до двухсот раз. По словам компании-производителя, это технологическое преимущество позволяет использовать семейство DD400 для географически удаленного архивирования данных, где архивация и складирование данных раньше не применялись, в силу необходимости оперировать с очень большими объемами данных, которые пересылать на большие расстояния раньше считалось экономически нецелесообразно.
Компания Network Appliances (NetApp) в последнее время проводит активную экспансию на рынок систем дискового архивирования и поглощает более мелкие компании, специализирующиеся на узкопрофильных решениях в области хранения данных. Одной их таких компаний стала Alacritus Software, производитель программных оптимизаторов для VTL-записи. Другое значимое поглощение — компания Decru, разработчик систем шифрования данных “на лету”. Все передовые разработки поглощенных компаний воплотились в новейшей дисковой системе хранения данных Nearstore VTL. Несмотря на заявленное позиционирование в качестве системы nearline, что видно из названия, эта система хранения обладает очень высокой емкостью и пропускной способностью, что делает её решением для крупных компаний, таких как операторы связи или научно-расчетные организации, оперирующие очень большими объемами данных с высокой скоростью передачи. Продуктовая линейка состоит из двух моделей — VTL600 и VTL1200, которые в различных вариантах поставки могут обладать емкостью до 84 и до 168 ТБ соответственно. Модели построены на базе уже хорошо зарекомендовавших себя на рынке D2D дисковых массивов NetApp, функции VTL в которых добавлены за счет интеграции управляющего ПО от поглощенной компании Alacritus. Архивирующее ПО “видит” систему Nearstore VTL как автозагрузчик с виртуальными ленточными картриджами фиксированной емкости, соответствующей стандартным индустриальным картриджам. Это значительно упрощает перенос данных на физические ленты в конце срока актуальной жизни информации. Системы линейки VTL умеют внедрять метаданные в каждый из потоков данных. Таким образом, в случае отказа управляющего устройства существует возможность просто переставить дисковые “полки” в другую систему линейки VTL, с сохранением гарантированной совместимости.
Другой производитель решений — компания FalconStor, предлагает полностью программное решение, которое устанавливается на сервер архивации и добавляет функциональность VTL к уже существующим дисковым системам хранения данных. При этом заявляется полная независимость от специфики аппаратуры вендора и совместимость со всеми аппаратными дисковыми массивами от наиболее распространенных производителей. Это бюджетное решение, предназначенное в первую очередь для компаний Small-to-Medium Enterprise, которые не могут себе позволить или считают неоправданным внедрение дополнительного аппаратного хранилища с функциональностью VTL. ПО FalconStor VirtualTape Library помимо своей прямой функции — организации виртуальных ленточных картриджей, также может выполнять программную оптимизацию хранимых данным, по методу, схожему с дифференциальной записью от компании Data Domain.