Ежегодный прирост объемов хранимых данных составляет порядка 60%. В условиях, когда ценность сохраненной информации и объемы данных растут, а бюджеты ИТ-отделов урезаются, все большую актуальность приобретает эффективность использования существующих систем хранения данных.

Наиболее очевидным средством увеличения эффективности использования систем хранения данных является использование одного устройства хранения для множества серверов и задач. На сегодняшний день большинство компаний уже отказалось от устройств хранения DAS (Direct Attach Storage), где на каждый сервер приходилась своя система хранения, переведя данные на устройства хранения SAN (Storage Area Network), NAS (Network Attach Storage) и др. Эти технологии позволяют делить ресурсы одной системы хранения между разными серверами и задачами. За счет консолидации задач на одном устройстве, заказчики значительно сокращают расходы на приобретение, поддержку и обслуживание оборудования, более гибко использует производительность и дисковое пространство системы хранения. Такие проекты мы реализовывали для ряда заказчиков в телекоммуникационной и финансовой сфере.

Разработанная более 10 лет назад технология SAN имеет и недостатки. Например, если у заказчика возникла потребность в увеличении производительности или объема дискового пространства, то в большинстве случаев вопрос приходится решать модернизацией системы хранения или ее заменой. В случае необходимости распределения нагрузки в качестве дополнительной системы хранения данных зачастую подключается более современное устройство хранения или устройство от другого производителя. Поэтому во многих случаях требуются дополнительные FC адаптеры, перенастройка SAN и программного обеспечения, отключение пользователей от приложений на время проведения работ. Кроме того, на обеих системах потребуется иметь запас дискового пространства и производительности на случай пиковых нагрузок и роста объема данных.

Для решения вопросов динамического распределения ресурсов между устройствами хранения ведущие производители предлагают решения по виртуализации, позволяющие объединять ресурсы в сети хранения данных в единое целое. Подобный проект был реализован нами для ЦОД Первого Украинского Международного Банка. Продукты по виртуализации имеют различную архитектуру – IBM SVC на основе серверов, EMC Invista – на базе коммутаторов, у компаний HP, Hitachi и SUN есть решения по виртуализации на основе контроллеров дискового массива уровня hi-end и т.д.

Перечисленные решения работают в неоднородном окружении, динамически перераспределяют нагрузку и дисковое пространство без остановки приложений и отключения пользователей. Решения по виртуализации дискового пространства позволяют повысить отказоустойчивость за счет применения локальной и удаленной репликации на дисковых массивах любого уровня. Кроме этого, упрощается администрирование за счет унификации интерфейса управления системами хранения данных, независимо от производителя устройств.

Дополнительно повысить эффективность использования оборудования можно путем перераспределения данных на разные по производительности устройства хранения. Так, данные с высокими требованиями по вводу-выводу, например, log файлы крупной промышленной базы, можно разместить на SSD (Solid State Disk) дисках, редко используемые данные переместить на SATA или ленточную библиотеку. Применение этой технологии позволяет снизить количество приобретаемых жестких дисков и, соответственно, стоимость оборудования, затраты на электроэнергию, охлаждение и обслуживание.

Перечисленные решения по консолидации и виртуализации систем хранения существенно повышают эффективность использования, но они не работают с данными. Зная структуру хранимых данных, можно в разы повысить эффективность использования путем исключения дублирующих элементов. Метод дедупликации имеет огромный потенциал по повышению эффективности использования систем хранения данных, так как значительная часть информации создается путем копирования на основе уже имеющейся информации. Наиболее очевидным является применение дедупликации данных в устройствах резервного копирования – виртуальных библиотеках. Действительно, если раз в неделю требуется делать полную резервную копию емкостью 100ГБ, а изменениям подвергается 5% данных, то без функции дедупликации две полных копии займут 200ГБ, а с функцией дедупликации – 105ГБ. Не удивительно, что практически все ведущие производители систем хранения в последнее время активно внедряют в программное обеспечение резервного копирования и виртуальные ленточные библиотеки функционал дедупликации, а NetApp применяет дедупликацию в своих NAS устройствах.


Применение всего перечисленного функционала по повышению эффективности использования систем хранения, а также обеспечение отказоустойчивости, создания резервных копий, разграничение доступа к данным требует высококвалифицированных специалистов по настройке и сопровождению таких систем. Кроме этого, для обеспечения непрерывности бизнеса и сохранности информации, системы хранения данных должны быть установлены в специально подготовленном помещении с резервным электропитанием, охлаждением, ограниченным доступом и т.п. Учитывая повсеместное урезание ИТ-бюджетов, все большее количество компаний готовы отдать заботы по хранению и обслуживанию информации специализированным компаниям.


Если описанные в статье технологии консолидации и виртуализации для систем хранения данных уже давно опробованы и применяются во множестве решений, то технологии SSD дисков, дедупликации и модель специализированного ИТ-обслуживания пока только делают первые шаги. По оценкам ведущих аналитических компаний, они имеют огромный потенциал и могут внести значительные изменения в ИТ-инфраструктуру предприятий в ближайшие годы.

Автор: Олег Горбунов, заместитель начальника отдела Систем хранения и обработки данных компании «СИТРОНИКС Информационные Технологии Украина»