В последние годы сегмент рынка хранилищ данных преобразился не только количественно, что выразилось в фантастическом увеличении плотности записи на носитель, но и качественно — рынок обогатился множеством разнообразных продуктов и технологий с широким спектром технических характеристик. На данный момент на рынке, в условиях жёсткой конкуренции, сражаются за покупателя несколько всемирно известных производителей, чьи продуктовые линейки могут удовлетворить запросы практически любого пользователя.


HP StorageWorks EVA поддерживает виртуализацию дисковых ресурсов в полном объёме
HP StorageWorks EVA поддерживает виртуализацию дисковых ресурсов в полном объёме
Цель данной статьи — помочь разобраться во множестве доступных на рынке технологий и продуктов и подобрать наиболее подходящее решение, отвечающее практическим задачам конкретного пользователя.

Эволюция стандартов

В конце 90-х гг. дисковые накопители подсоединялись к серверу в основном по принципу Direct Attached Storage (DAS), т.е. диски размещались непосредственно внутри корпуса сервера. И хотя на тот момент уже десяток лет существовала технология FibreChannel, она не находила массового применения по причине дороговизны, а использовалась только в масштабных вычислительных комплексах, общая доля которых составляла единицы процентов. Тем не менее, если требуется объединить — например, с целью непрерывной репликации или синхронизации — несколько территориально разрозненных вычислительных комплексов или серверных гермозон с высоким уровнем трафика, оптоволокно и по сей день остаётся технологией, решающей эту задачу эффективно и надёжно.

В настоящее время в основе большинства существующих систем хранения данных лежит технология Storage Area Network (SAN). Она отличается от других типов сетей хранения данных используемым низкоуровневым методом доступа. Тип данных, который передаётся через сеть SAN, по структуре очень похож на те данные, которые передаются от внутренних дисковых накопителей к контроллеру при схеме подключения DAS. Выигрыш от применения SAN очевиден. Во-первых, отсутствуют промежуточные низко- и высокоуровневые преобразования данных и команд, что повышает быстродействие и надёжность комплекса в целом. Во-вторых, дисковые массивы могут быть физически отделены от сервера, которому отводится роль вычислительной машины.

Дисковые массивы различных классов


IBM TotalStorage DS4x00 основана на популярной системе хранения FAStT и построена по модульному принципу
IBM TotalStorage DS4x00 основана на популярной системе хранения FAStT и построена по модульному принципу
Наиболее популярным и распространённым форм-фактором в данное время являются модульные дисковые массивы. В отличие от тяжёлых и часто слишком дорогих решений, конструктивно выполненных в виде отдельных шкафов или стоек, модульные дисковые массивы среднего класса завоевали популярность в том числе и благодаря исполнению в стандартных “юнитовых” корпусах и возможности установки в стандартную 19-ти дюймовую стойку. Чаще всего в таких случаях вся управляющая логика и интерфейсы взаимодействия выносятся в отдельный одноюнитовый модуль, а сами дисковые массивы, не имеющие собственных процессоров, устанавливаются в стойку в виде отдельных модулей. По мере надобности система хранения данных может масштабироваться путём добавления дополнительных дисковых модулей.

Одним из первых дисковых массивов с модульной конструкцией был продукт под названием EVA, разработанный и выпущенный компанией Compaq. Сегодняшние “наследники” первого модульного дискового массива продаются уже под брендом Hewlett-Packard и включают в себя все современные разработки в этой области. Производитель позиционирует дисковые массивы EVA как систему хранения для серверов среднего и высокого уровня, в том числе и для UNIX-серверов. По заверениям производителя, на данный момент системы хранения HP EVA — единственные продукты на рынке, которые действительно поддерживают виртуализацию данных в полном объёме. Дисковые массивы семейства EVA консолидируют параметры всех дисков в единый виртуальный ресурс, в пределах которого системный администратор может создавать нужные блоки с заданными параметрами, а процессорная логика автоматически выполняет на физическом уровне все функции по распределению задач между дисками. Кроме того, в семейство EVA входят диски специального стандарта FATA. Конструктивно они не отличаются от доступных по цене дисков стандарта SerialATA, но, благодаря наличию в них интерфейса FibreChannel, их можно непосредственно устанавливать в одном модуле с FC-дисками без дополнительного промежуточного сопряжения.


Характеристики дисковых массивов*
Характеристики дисковых массивов*
Корпорация IBM также разрабатывает дисковые массивы, используя при этом как собственные технологии, так и разработки приобретённых ею компаний. Популярная несколько лет назад линейка дисковых систем хранения FAStT пополнилась новейшей системой с индексом “DS4000”. В ней нашли воплощение наработки компании Engenio, бывшего подразделения LSI Logic — известного разработчика дисковых технологий и продуктов. Новое семейство рекомендуется использовать для оснащения территориально удалённых резервных систем хранения данных, а также в качестве дисковых массивов для мэйнфреймов IBM семейства iSeries. В дисковых массивах семейства DS4000 реализованы функции мгновенного копирования данных, удалённого зеркалирования, а также динамического изменения размера томов. Во флагманской модели, DS4800, применён новейший интерфейс FibreChannel со скоростью передачи данных 4 Гбит/с, за счёт чего максимальная пропускная способность системы возросла до 1600 МБ/с.


Sun StorEdge 6920 может без проблем объединяться в один комплекс с серверными системами других производителей
Sun StorEdge 6920 может без проблем объединяться в один комплекс с серверными системами других производителей
Система Sun StorEdge 6920 существенно превосходит конкурирующие решения по объёмам кэш-памяти и количеству хост-портов. Она предназначается для оснащения вычислительных комплексов, предъявляющих повышенные требования не только к отказоустойчивости, но и к быстродействию дисковой подсистемы. StorEdge 6920 может без проблем объединяться в один комплекс с серверными системами производства других вендоров. Этот дисковый массив обладает уникальной архитектурной особенностью — он может объединять в общий виртуальный ресурс как внутренние диски, так и внешние дисковые массивы. Вместе со StorEdge 6920 поставляется программный комплекс, который предназначен для управления виртуализацией данных. В его состав входят несколько приложений. Pool Manager реализует консолидацию хранения путём виртуализации систем, выпущенных разными производителями. Data Replicator выполняет удалённую репликацию томов данных с дисковых массивов Sun, а также EMC и HP для защиты от локальных и крупномасштабных аварий. Data Mirror позволяет создать полную копию томов данных приложений, которую можно использовать для резервного копирования и тестирования и быстро синхронизировать с оригиналом. Наконец, Data Snapshot предназначена для получения мгновенных снимков данных приложений.

Роль ленточных накопителей

После заметного падения стоимости дисковых систем хранения в последние 2—3 года и роста их скоростных и ёмкостных показателей, в ИТ-индустрии получило распространение мнение о том, что медлительные ленточные накопители с последовательным доступом к данным скоро отправятся на свалку истории, уступив место дисковым накопителям, которые будут использоваться, в том числе, и для резервного копирования данных. Однако такое мнение ошибочно, поскольку не учитывает специфики и исходного предназначения ленточных накопителей. Последние до сих пор широко востребованы на рынке хотя бы потому, что предоставляют заказчику самую дешёвую удельную себестоимость хранения 1 гигабайта информации. Дисковые системы хранения данных не смогут заменить ленту, равно как и ленточные накопители не заменяют диски. Эти технологии имеют разное предназначение и взаимно дополняют друг друга при создании единого центра хранения данных. Дисковые системы архивации предназначены для репликации или зеркалирования данных, они могут обеспечить быстрое восстановление работоспособности при выходе из строя основного массива. В то же время они уязвимы, поскольку дисковый массив нельзя, в буквальном смысле, вынуть из стойки и унести с собой. Архивирование данных на ленту позволяет восстановить систему после серьёзных катастроф, например после выхода из строя целого вычислительного комплекса. Лента хороша и тем, что кассету можно перенести территориально в другое место, обеспечив при этом катастрофоустойчивость. Поэтому в общей топологии хранилища данных обязательно должно найтись место архивному ленточному накопителю.


Краткий глоссарий по storage-аббревиатурам

Аббревиатура
Расшифровка
Буквальный перевод
Пояснение
DAS
Direct Attached Storage
Непосредственное подсоединение хранилища
Технология, предусматривающая размещение дисковых устройств непосредственно в корпусе сервера
NAS
Network Attached Storage
Подсоединение хранилища по сети
Дисковые массивы, выделенные в отдельные устройства с подключением к серверам по сети
SAN
Storage Area Network
Сеть хранилищ
Сетевая технология, описывающая стандарты сети, предназначенной для объединения дисковых массивов, ленточных библиотек и прочих хранилищ данных с серверами
SAS
Serial Attached SCSI
Последовательный SCSI
Новый стандарт дисков, пришедший на смену “классическому” параллельному SCSI
SCSI
Small Computer
System Interface
Системный интерфейс малых компьютеров
Стандарт дисковых накопителей, который выступал в качестве индустриального стандарта де-факто для серверных дисковых накопителей на протяжении последних 20-ти лет