Устройства хранения данных сетевого подключения занимают особое место в ряду дисковых подсистем, поскольку берут на себя большую часть рутинных процедур поддержания жизнеспособности ИТ-инфраструктуры в целом. Меняется и отношение к ценности хранимых данных: если раньше активом считалось лишь содержимое корпоративных баз данных, то сейчас обращают внимание на коммерческую ценность данных систем безопасности и контроля доступа, видеонаблюдения, архивов видеоконференций, образов стандартизированных рабочих мест и многое другое.
Сценарии наращивания дисковой емкости для хранения корпоративной информации зависят от масштабов бизнеса, его бизнес-логики, ценности данных, требований к их доступности, безопасности и управляемости. Наиболее дальновидные компании строят сети хранения данных (SAN). На дисковых массивах такой сети размещается наиболее важная информация — к примеру, база данных системы автоматизированного управления предприятием, база данных CRM или корпоративной системы обмена информацией (почта, документооборот) и реже — пользовательские данные. В таких системах обеспечивается высокая надежность хранения информации, организовано регулярное резервное копирование. Недостаток таких сетей заключается в использовании довольно дорогостоящей технологии Fiber Channel (FC), что отражается как на стоимости массивов и серверов, так и на цене проектов по развертыванию и сопровождению. К тому же многие типы хранимых данных вовсе не нуждаются в использовании интерфейса FC.Для хранения данных разных типов более оптимально использовать массивы сетевого доступа, подключаемые к сети Ethernet. Они «выросли» из традиционных файловых серверов, управляемых ОС общего назначения. В малых предприятиях такие серверы выполняют роль центрального хранилища общей базы данных (БД) и части папок общего пользования. В крупных организациях с сетями хранения данных SAN на файловых серверах централизованно хранятся пользовательские профили, файлы и папки, почтовые базы данных, а в последнее время файловые серверы все чаще используются как хранилища SharePoint. На них же (как правило, на устаревших системах) хранятся резервные копии документов, образы рабочих мест пользователей и серверов, различные видеоданные. К слабым сторонам использования набора файловых серверов с ОС общего назначения можно отнести сложность администрирования, «распределенность», а значит и усложненное резервное копирование, относительную дороговизну ввода в эксплуатацию и дальнейшей поддержки. И все же использование более “демократичного” протокола в сочетании со специализированными ОС открывает для файловых серверов и их прямых сетевых «наследников» большие перспективы — ведь количество предоставляемых пользовательских служб в сети растет, усложняются требования к управлению данными и информационной безопасности.
Возможности и перспективы систем хранения данных
Развернуть сеть хранения данных (СХД) под силу предприятиям практически любого уровня. А с ростом капитализации бизнеса появляется дополнительный стимул для внедрения скоростной и надежной сети обработки, передачи и хранения данных. Компании, независимо от ее размеров, необходимо четко спланировать инфраструктуру разделения серверов на вычислительные средства и устройства хранения данных в соответствии с потребностями её бизнеса. Системы хранения призваны обеспечить эффективность использования ресурсов.
СХД разделяют по способу их подключения к серверам на три класса:
• DAS (Direct Attached Storage) — системы хранения, непосредственно подключаемые к серверу;
• NAS (Network Attached Storage) — системы хранения, включаемые в локальную сеть;
• SAN (Storage Area Network) — сети хранения данных.
Преимущество DAS — простота подключения и относительно невысокая цена всего решения. Применение массивов прямого подключения оправданно для использования на рабочих станциях, нуждающихся в больших объёмах дискового пространства для локальных вычислений (например, хранилище в паре со станцией нелинейного видеомонтажа). Недостатком DAS-систем является их сравнительно низкая производительность и невозможность масштабирования. Кроме того, непосредственная близость сервера и системы хранения порождает проблему безопасности и контроля физического доступа. Для организации коллективной работы сотрудников над единым массивом данных такие системы нельзя считать оптимальными.
В основу технологии NAS заложены принципы файловых серверов. Передача между сервером и системой хранения обеспечивается средствами локальной сети, что существенно снижает стоимость решения. NAS-массивы просты в установке и обслуживании. Основным их назначением является хранение данных на удалённом носителе с возможностью разделения прав доступа. Со стороны пользователя решение принимает вид подключаемых сетевых дисков. Уровень отказоустойчивости подобных систем позволяет использовать их для выполнения резервного копирования, миграции данных, аварийного восстановления и т. п. Отличие NAS-серверов от обычных серверов — в использовании ОС, оптимизированной под задачи хранения данных (например, у Microsoft это Windows Storage Server, отличающаяся от стандартной Windows Server 2003 большей производительностью, простотой настройки, лицензированием). ПО большинства разработчиков NAS-серверов предусматривает поддержку клиентов различных ОС.
Среда SAN — это сеть высокоскоростной передачи данных, компонентами которой являются серверы, системы хранения (дисковые массивы, ленточные библиотеки) и коммутаторы SAN. Взаимодействие между компонентами осуществляется при помощи скоростных каналов (обычно Fiber Channel). Основная идея SAN состоит в разделении устройств хранения и серверов приложений — в этом случае последним не приходится тратить ресурсы на управление дисковой подсистемой. Преимущества SAN — высокая производительность и масштабируемость. SAN применяют в случаях, когда обслуживаемые приложения выдвигают высокие требования к производительности системы. Как правило, это многопользовательские системы с активными дисковыми операциями. Особенностью SAN является возможность территориального разнесения её компонентов, что необходимо при построении катастрофоустойчивых кластеров. К недостаткам SAN на основе Fiber Channel относится сравнительно высокая стоимость развертывания и обслуживания решений.
В последнее время активное развитие получили SAN, использующие для обмена информацией протокол IP. Элементы решения можно объединять при помощи обычного Ethernet. Серверы обращаются к дисковым массивам через протокол iSCSI (SCSI over IP). Преимуществом сетей хранения на базе IP является умеренная стоимость, которая достигается благодаря низкой стоимости компонентов инфраструктуры. Решения NAS и iSCSI-SAN используют одинаковую среду передачи данных. Это сходство подтолкнуло многих производителей программного обеспечения к разработке платформы DSS (Data Storage Server), поддерживающей оба способа обмена данными.
Считается, что развитие технологии IP-SAN сдерживается низкой производительностью как самих устройств хранения iSCSI, так и в силу смешения в одной сети Ethernet трафиков различного происхождения (хранилищ и прочих систем). В этом вопросе помогает сегментирование сети, использование сетевых средств приоритизации трафика, установка на дисковых массивах специализированных сетевых NIC/iSCSI-карт, аппаратные контроллеры которых разгружают центральные процессоры по обслуживанию стека TCP и протокола iSCSI.
Чтобы обеспечить безопасное хранение данных, информацию структурируют по разным типам СХД. Такие системы обслуживаются как единый ресурс, использовать который могут и локальные, и удаленные приложения. Мультипротокольные сети SAN поддерживают различные способы обмена данными, легко управляются удаленно и обеспечивают существенное снижение угрозы несанкционированного вмешательства в работу предприятия.
Баланс интересов
Поскольку дисковые массивы сетевого доступа имеют многоцелевое назначение, для сравнения оборудования логичнее применять не количественные критерии (такие как «цена-производительность»), а качественные оценки — например, эффективность с точки зрения достижения бизнес-задач.
Производительность. От NAS- и iSCSI-массивов не ждут высокой скорости выдачи данных. Пределы пропускной способности заданы типом внешнего интерфейса и протоколами передачи данных. Для соединений 1—10 GbE существует технологическое ограничение по обработке пакетов TCP. Агрегация каналов и использование аппаратных ускорителей стека TCP (в случае iSCSI) смягчают, но не снимают проблему низкой скорости передачи данных. Сети IP-SAN только до некоторого предела могут конкурировать с FC-SAN, при том, что с ростом нагрузки затраты на решение на Fiber Channel будут меньше, а производительность - выше. С другой стороны, NAS-сервер покажет себя на 15-20% производительнее обычного сервера с неспециализированной ОС на той же аппаратной платформе — это оправдывает выделение массивов сетевого доступа в отдельный класс устройств, управляемых профильным ПО.
Функциональность. NAS-серверы уникальны своей “всеядностью”. Они рассчитаны на работу в гетерогенных средах, с разнообразными сетевыми протоколами, легко интегрируются в любую ИТ-среду и способны обеспечивать как файловый, так и блочный доступ (при добавлении функций iSCSI) к дисковому пространству. Их можно объединять в отказоустойчивый кластер и обеспечивать единую точку доступа к данным для всех пользователей. Им нет равных по спектру предоставляемых видов сервиса, как административных (ограничительных), так и пользовательских, в части интеграции в сетевую инфраструктуру и доступа к общему информационному пространству.
Управляемость. Встраиваемые аппаратные средства дают возможность удаленно контролировать параметры систем, управлять питанием, обновлять прошивки и ПО. Средства интеграции с внешним ИТ-окружением привязаны к ОС. Высокоуровневое управление через веб-интерфейс позволяет раздавать квоты, управлять контентом, готовить отчеты об использовании ресурсов дискового пространства. Трехуровневая иерархия позволяет четко распределить обязанности между различными группами администраторов и оптимизировать инструменты управления.
Надежность. В отношении устройств, обслуживающих всех пользователей сети, правильно говорить не о дублировании компонентов, а о снижении возможного времени простоя (в том числе вследствие выхода компонентов из строя). Разумеется, NAS-серверы строят с использованием резервных устройств, критичных к отказам подсистем, но они также имеют средства локальной и глобальной репликации — для ускорения восстановления доступности данных. Надежность хранения в ИТ-инфраструктуре с использованием NAS существенно выше, чем при использовании обычных файл-серверов, а допустимое время простоя сравнимо с показателями сетей SAN.
Безопасность и консолидация данных. Информационная безо-пасность непосредственно связана с консолидацией данных. Централизованные коммерческие данные проще в обслуживании и контроле доступа. Это касается также архивов видеонаблюдения и систем разграничения доступа. Построенные на специализированных ОС, серверы NAS менее подвержены сетевым атакам, а различные антивирусные пакеты позволяют организовать полный контроль всех файловых операций.
В сервис-ориентированных информационных сетях фокус естественным образом смещается с вопросов владения устройствами в сторону организации эффективного доступа к данным. Собственная серверная комната уже не является оптимальным местом хранения ценной коммерческой информации, тем более что использование TCP/IP дает широкие возможности для обеспечения сохранности данных, где бы они ни находились. А также свободу в выборе инструментов администрирования, информативность средств управления и контроля, снижение затрат на сопровождение. Сегодня территориально распределенные организации стремятся к централизации своих вычислительных ресурсов. Консолидация серверов и снижение числа поддерживаемых программных платформ обеспечивают организации долгосрочную экономию расходов за счет общей оптимизации инфраструктуры и связанных с ней процессов.