Свое новое устройство хранения данных StorageWorks RISS 1.4 компания Hewlett-Packard построила на базе grid-архитектуры, что обеспечило строгое соответствие хранящихся здесь архивов самым жестким законодательным требованиям и позволило намного ускорить поиск нужной информации.


Система RISS масштабируется с помощью дополнительных аппаратных модулей
Система RISS масштабируется с помощью дополнительных аппаратных модулей

На сегодняшний день менеджеры ИТ испытывают острую необходимость в хранилищах большой емкости и оптимизации поиска нужной информации в них. В таких условиях многие корпорации начинают уделять повышенное внимание технологии контентной адресации CAS, примером реализации которой может служить HP StorageWorks RISS (Reference Information Storage System).

Новинка Hewlett-Packard — это не просто массив жестких дисков. Модульная RISS 1.4 представляет собой отличную систему архивирования, где богатые средства управления успешно сочетаются с мощными возможностями резервирования серверов электронной почты, приложений и файлов.

Нельзя, впрочем, не отметить, что RISS 1.4 блистает лишь там, где востребованы заложенные в нее функции индексации, например в хранилищах сообщений и документов. Когда же дело доходит до хранения графических (скажем, медицинских рентгенограмм) или мультимедийных файлов, эта система никаких особых преимуществ не дает, хотя каждый гигабайт здесь обходится намного дороже, чем в традиционных хранилищах. Начальная цена устройства составляет 112 тыс. долл. — за эти деньги клиент получает дисковое пространство общей емкостью 1,7 ТБ.

Наращивание возможностей системы производится посредством специально созданных модулей SmartCell, каждый из которых по существу представляет собой сервер серверов HP ProLiant. Подключая такие дополнительные устройства, можно постепенно увеличивать и пространство хранения данных, и вычислительную мощь решетки RISS. Для повышения надежности модули добавляются в решетку попарно, причем каждая пара увеличивает общую емкость системы на 850 ГБ полезного пространства. Данные здесь хранятся на встроенных жестких дисках Ultra SCSI, работающих под управлением контроллера RAID.

Всего в одну сетку RISS 1.4 можно включить до 250 модулей SmartCell, что позволяет создавать хранилища петабайтной емкости. Вот только для этого требуются специализированные модули, и об экономии за счет применения более дешевых стандартных серверов говорить не приходится. К лету нынешнего года представители Hewlett-Packard обещают довести емкость SmartCell до 1,4 ТБ. При этом менеджерам ИТ ничто не помешает комбинировать их с прежними 850-ГБ устройствами. Таким образом, для расширения хранилища в него можно будет добавлять пары модулей нового типа с сохранением приобретенных ранее.

Поисковый Webинструментарий помог нам найти в хранилище RISS нужный контент и сохранить его
Поисковый Webинструментарий помог нам найти в хранилище RISS нужный контент и сохранить его

Более того, допускается сочетание модулей емкостью 1,4 ТБ и 850 ГБ даже в одной паре, однако это нецелесообразно, так как в результате зеркалирования даже в модуле нового типа будет задействовано только 850 ГБ.

Поиск в контенте

На аппаратном уровне RISS мало чем отличается от обычного стека серверов, связанных между собой внутренней IP-сетью. Главная изюминка хранилища кроется в его ПО, которое сохраняет индексы всего контента в единой базе данных и обеспечивает поиск по всем подключенным модулям SmartCell.
RISS 1.4 позволяет архивировать самый разный контент, включая сообщения электронной почты и документы. Каждый поступающий в архив файл снабжается уникальным идентификатором, который рассчитывается на базе алгоритма безопасного хеширования SHA-1 (Secure Hash Algorithm). Возможности новинки по сохранению сообщений электронной почты, как показало проведенное в eWeek Labs тестирование, находятся примерно на том же уровне, что и у решений наподобие Enterprise Vault корпорации Symantec. Большинство систем архивирования, как известно, адаптируется для работы с Microsoft Exchange, и RISS 1.4 — не исключение. Для получения электронной почты из системы Microsoft здесь применяется протокол MAPI (Messaging Application Programming Interface).


Средства управления RISS позволяют контролировать все компоненты CAS
Средства управления RISS позволяют контролировать все компоненты CAS
Согласно документации, RISS 1.4 поддерживает и IBM Lotus Domino. Сообщения с таких почтовых серверов сначала передаются на аппаратный шлюз Domino, а оттуда поступают в систему RISS для индексации и хранения. Справедливости ради отметим, что в eWeek Labs работа с Domino не проверялась.

RISS довольно хорошо интегрируется с Microsoft Outlook. Для этого, правда, на клиенты нужно разослать файл MSI (Microsoft Windows Installer), после чего интерфейс Outlook дополняется панелью поиска, графическими маркерами разметки архивированного контента (их создатели продукта назвали “надгробными камнями” — tombstone) и элементами автономного кэширования. Заложенные в RISS 1.4 функции архивирования отлично согласованы с Outlook, благодаря чему переучивать пользователей работе с ними почти не придется. Интересен и автономный кэш системы, позволяющий мобильным сотрудникам работать с архивом сообщений RISS даже в дороге. Тем же, кто тонет в море файлов .pst (Personal Storage Table), Hewlett-Packard бросает спасательный круг в виде функции импорта, с помощью которой нетрудно перенести такой контент с ноутбуков и настольных систем в корпоративное хранилище.

Профили архивов

В RISS предусмотрены два базовых типа профилей для пользователей архивов электронной почты. Первый из них предназначен для тех, чья деятельность в соответствии с законодательством подлежит особенно строгому контролю, — здесь в архив заносятся все сообщения и в полном объеме применяются правила безопасного хранения данных. Второй профиль рассчитан на обычных пользователей и позволяет менеджеру ИТ самостоятельно определять правила архивирования (он, скажем, может налагать ограничения на размер сообщений, оговаривать особый порядок обращения с письмами определенных адресатов и адресантов).


Автономный архив RISS 1.4 сохраняет доступ пользователя ко всем ресурсам даже без подключения к сети
Автономный архив RISS 1.4 сохраняет доступ пользователя ко всем ресурсам даже без подключения к сети
Стоимость лицензии с первым типом профиля несколько ниже, однако бoльшую экономию можно все же получить при использовании стандартного профиля, если только менеджер ИТ тщательно продумает и задаст правила его применения. Конкретизировать цену обоих вариантов представители Hewlett-Packard не стали.

Как показало тестирование RISS 1.4, функция обнаружения контента очень проста в работе и со своей задачей справляется довольно быстро. В системе предусмотрен солидный карантинный репозиторий, куда ревизоры могут помещать результаты выполнения предыдущих запросов.

Тем клиентам, которые захотят добавить данные в решетку, Hewlett-Packard предлагает агент миграции файлов HP StorageWorks FMA начальной ценой 2400 долл. в расчете на один сервер. На сегодняшний день он поддерживает только серверы Windows, помогая менеджерам ИТ создавать архивную политику пересылки контента в решетку RISS. Способность этого агента производить репликацию на уровне файлов сходна с функциональностью других подобных систем, включая хранилища Xosoft.

Как и следовало ожидать от решения с контентной адресацией, RISS 1.4 поддерживает технологию SIS (Single Instance Storage — хранение одного экземпляра). Другими словами, в сетке RISS может храниться только одна копия каждого сообщения или документа, а остальные автоматически удаляются. У такого подхода, правда, есть и слабая сторона: достаточно изменить в документе 1—2 байта, как RISS 1.4 тут же создает новый документ. Чтобы избавиться от этого недостатка и сделать хранение более эффективным, в следующую версию RISS, 1.5, как пообещали представители Hewlett-Packard, будет добавлена функция удаления дублирования (deduplication). Если, скажем, в 16-МБ презентации PowerPoint пользователь вставит или удалит слово, система просто отметит изменения, но создавать новую версию такого большого файла не станет.

По истечении срока хранения данных SmartCell сотрет соответствующий файл и удалит с диска все его следы, используя для этого технологии, принятые в военном ведомстве. В результате восстановить файл уже никому не удастся.

В будущем Hewlett-Packard обещает включить в свой продукт поддержку технологии ХАМ (Extensible Access Method), но когда это произойдет, зависит от хода утверждения спецификации. Рассматривается также возможность поддержки стандарта JSR-170, однако какого-либо решения по этому вопросу пока не принято.

Web-ресурсы

Фактор RISS
д Дополнительная информация об устройстве RISS компании Hewlett-Packard (h18006.www1.hp.com/products/storageworks/riss/index.html).

Java Community Process
д Информация о JSR-170 — интерфейсе прикладного программирования репозитория контента для технологии Java (www.jcp.org/en/jsr/detail?id=170).

Перспективы ХАМ
д Технический обзор протокола XAM, подготовленный Ассоциацией индустрии сетевого хранения SNIA (www.snia-dmf.org/xam/index.shtml).

Хранение неструктурированного контента по ЕМС
д Взгляд на технологию CAS корпорации ЕМС, которая первой предложила данный термин (www.emc.com/products/networked/cas/index.jsp).

Программные решения
д Часто задаваемые вопросы по программной системе контентной адресации Caringo (www.caringo.com/faq.html).

Резюме ДЛЯ РУКОВОДИТЕЛЕЙ

 

StorageWorks RISS 1.4
Аппаратно-программный комплекс StorageWorks RISS 1.4 компании Hewlett-Packard — это мощное решение с контентной адресацией, которое предлагает богатые возможности архивирования электронной почты, а также позволяет резервировать данные с серверов файлов и приложений. По мере роста потребностей в хранении менеджер ИТ может быстро наращивать систему, добавляя в нее специализированные модули SmartCell, а найти и устранить возникающие при этом проблемы ему помогут встроенные в RISS 1.4 средства управления. Ближе познакомиться с новинкой можно по адресу: www.hp.com.

ЦЕНОВОЙ АНАЛИЗ.
В минимальной комплектации, обеспечивающей хранение 1,7 ТБ данных, RISS 1.4 стоит 112 тыс. долл. Такие расходы могут быстро окупиться благодаря способности комплекса быстро находить нужные данные, однако его едва ли стоит развертывать для хранения цифровых мультимедийных и графических файлов, контент которых средствами RISS 1.4 не индексируется.

КРАТКИЙ СПИСОК АНАЛОГОВ
Centera корпорации ЕМС. Самая первая из появившихся на рынке систем хранения неструктурированного контента, которая до сих пор служит образцом для других производителей (www.emc.com ).
Compliance Vault фирмы Permabit. Фирма Permabit (www.permabit.com ) заключила ОЕМ-соглашение с StorageTek — дочерней компанией Sun Microsystems.