Современный бизнес целиком и полностью зависит от информационной обеспеченности, а информация является главнейшим ценным активом крупных компаний. Деятельность многих компаний уже давно вышла за пределы одного города, региона, страны или континента, поэтому все чаще требует от ИТ-инфраструктуры обеспечения круглосуточной поддержки. Например, электронные торговые площадки и сервисы, поддерживающие их, веб-сайты компании, почтовые службы и т.д. Таким образом, администраторы подобных систем зачастую имеют либо чрезвычайно маленькое “окно”, либо полное его отсутствие для проведения резервного копирования на традиционные ленточные накопители.


Иерархия ярусов (tier) комплексной системы хранения
Иерархия ярусов (tier) комплексной системы хранения

В этом случае единственным способом создания резервных копий является использования дисковых накопителей в качестве буфера. За последние несколько лет произошло существенное увеличение емкости жестких дисков, в то же время стоимость одного мегабайта дискового пространства стала меньше. Хранение данных на дисках по стоимости теперь сопоставимо с хранением данных на ленте, и вместе с тем имеет очевидное преимущество — скорость доступа. Может сложиться ошибочное мнение, что традиционные методы ленточного резервного копирования больше не нужны, однако это не так. Ленточные накопители перешли в класс архивных устройств, обеспечивающих сохранность данных на долгие годы, и позволяют уйти от концепции “хранения яиц в одной корзине”. Достаточно вспомнить трагедию 11 сентября с США, после которой многие компании прекратили свое существование только потому, что вовремя не вывезли архивные копии данных в надежное место.

В настоящее время системы хранения имеют многоярусный принцип строения. Каждый из таких ярусов (tier) обеспечивает свой уровень надежности и доступности данных. Количество ярусов обусловлено конкретными задачами, финансовой целесообразностью и возможностями аппаратно-программных средств.

Следует отметить, что “хребтом” для построения такого вида систем служит сеть хранения данных — СХД (русскоязычный аналог зарубежного термина SAN — Storage Area Network).

Наиболее простая и понятная концепция трехуровневой системы хранения данных, которая при необходимости может быть как сокращена, так и расширена, имеет следующую структуру.

В первый ярус системы обычно входят наиболее важные серверы и их дисковые подсистемы, а также системы хранения данных, обслуживающие прикладные задачи, для которых важен высокий уровень готовности и доступности. Яркий пример — все без исключения задачи и процессы транзакционного характера. Как правило, серверы такого рода ориентированы на высоконадежную дисковую систему или подсистему. Она имеет относительно небольшую емкость, но способна выполнять достаточное количество операций ввода-вывода. Наиболее подходящими для таких задач являются диски, рассчитанные на круглосуточную работу в течение нескольких лет, с высокой степенью нагрузки. Интерфейс диска в этом случае зависит от топологии дисковой подсистемы или дисковой системы. Для повышения готовности дисковых систем и подсистем применяют самые разнообразные методы: начиная от организации RAID-массивов из накопителей и заканчивая зеркалированием или реплицированием непосредственно самих систем хранения данных.

Во второй ярус могут входить второстепенные серверы приложений, файловые серверы и серверы поддержки первого яруса, системы и подсистемы хранения, построенные на основе недорогих дисков большой емкости. В настоящее время для организации дисковых подсистем и систем второго уровня используют диски, рассчитанные на круглосуточную групповую работу в составе сервера или дисковой системы с небольшой нагрузкой в течение нескольких лет. Интерфейсы дисков в этом случае также определяются общей топологией системы. Наиболее популярны интерфейсы FC и SATA. Дисковые подсистемы и системы большой емкости служат для быстрого резервного копирования данных систем хранения первого уровня, миграции малоиспользуемых данных с дорогих дисковых носителей первого уровня на дешевые, но более емкие носители второго уровня. Это дает возможность пользователям получать оперативный доступ к своим данным. Характерным примером миграции данных на более дешевые носители может быть работа почтовых серверов. Не секрет, что пользователи очень неохотно расстаются со своими письмами, зачастую содержащими большие вложения. Старые письма пользователей занимают драгоценное место на дорогих дисках почтовых серверов. Если применить программные средства, которые выполняют вытеснение или миграцию таких старых или больших писем на более дешевые носители вплоть до ленточных, то это позволит освободить диски почтовых серверов для других задач, а пользователи получат возможность долгосрочного хранения своих писем. Аналогичный подход применим и к файл-серверам, а также серверам баз данных.

Третий ярус системы может содержать устройства резервного копирования самого разного рода: ленточные, магнитооптические, оптические, в форме отдельных приводов и в составе библиотек — все зависит только от конкретных задач, возможностей и вопросов целесообразности. Основная функция — это создание архивных копий данных с носителей второго уровня для последующей их отправки в хранилища. Некоторые библиотеки могут быть использованы для следующего этапа миграции данных уже с дисков на ленты или оптические носители. Третий ярус системы обеспечивает восстановление данных в самых критических ситуациях, когда все уровни системы выведены из строя — например, при стихийных бедствиях, пожарах, террористических актах. То есть создание самой резервной копии подразумевает последующее хранение носителя в защищенном месте.

В итоге реализация системы резервного копирования в каждом отдельном случае будет зависеть от ценности данных для компании, стоимости потерь при простоях.

Наиболее критичные ярусы системы могут быть продублированы и иметь избыточные соединения. Дублированные системы обычно размещают на достаточном расстоянии друг от друга, снижая риски, связанные с техногенными катастрофами или стихийными бедствиями. Возможно использование нескольких систем, которые могут стоять в резерве или под нагрузкой.

При разработке общей концепции следует руководствоваться принципом здравого смысла. Принятие решений зависит от стоимости данных или стоимости минуты простоя для компании. Исходя из этих данных, специалисты помогут определить наиболее критичные узлы системы, целесообразность тех или иных методов дублирования или резервирования и подберут необходимое программное обеспечение. 

С Игорем Макаровым, техническим экспертом компании Seagate, можно связаться по адресу Igor.N.Makarov@seagate.com