В современной бизнес-среде, зависящей от компьютерных систем и возможностей моментальных коммуникаций, информация становится таким же активом, как персонал, денежные средства или бизнес-операции, которыми необходимо управлять. Для продвижения продуктов и услуг в этой области большинство компаний-производителей активно эксплуатируют стратегию “Information Lifecycle Management”, или управление жизненным циклом информации.


Распределение данных по различным системам
Распределение данных по различным системам

При этом состав и функциональные возможности предлагаемых продуктов охватывают широкий спектр задач и не поддаются классификации или сравнению. По этой причине зачастую специалисты, для которых разрабатываются такие продукты и решения, стоят перед достаточно сложной задачей выбора.

Целью стратегии ILM является пре­доставление адекватного уров­ня сервисов по отношению к соответствующим типам данных по оправданной цене. Существует ряд основных понятий и принципов, позволяющих сформировать такую стратегию и определить практическую составляющую понятия ILM.

Ценность информации определяется бизнесом. В интересах бизнеса информация накапливается и используется в самых разных формах. В зависимости от текущего бизнес-процесса ценность данных может быть выше или ниже. В соответствии с целями, для которых данные необходимы, доступ и наличие последних может иметь критичное для бизнеса значение. Иными словами, данные обслуживают интересы бизнеса, а бизнес-контекст определяет их ценность.

Ценность данных меняется со временем. Данные могут иметь различную ценность и видоизменяться, равно как со временем может меняться и режим доступа к ним. Неожиданное событие (например, аудит), может влиять на необходимость быстрого доступа к требуемым данным, и тогда данные снова переходят в активное состояние. С течением времени данные могут терять свою ценность и удаляться, но такой период может быть очень длительным. На этом жизненный цикл данных может завершаться. Однако не все создаваемые данные имеют одинаковую ценность и, кроме того, ценность данных со временем меняется.

Многоуровневые системы хранения данных являются основой систем управления жизненным циклом данных. Одной из основных задач систем является снижение стоимости хранения данных при сохранении необходимого режима их использования. Со­з­­дание ресурсов хранения дан­ных должно осуществляться с ис­пользованием систем, обладающих раз­личными показателями дос­тупности, производительности, функциональности и стоимости в сочетании с распределением данных по таким системам в соответствии с требованиями приложений.

В целом, идея управления жизненным циклом информации существует давно и практически не претерпела изменений. На аппаратном уровне стоимость хранения данных оптимизируется при помощи миграции данных на менее дорогие носители. До недавнего времени эта задача решалась при помощи архивирования устаревших данных на ленточные накопители. Среди основных недостатков необходимо упомянуть сложность, а иногда и невозможность найти необходимые данные в нужный момент.

Существенное удешевления систем оперативного хранения данных (дисковых подсистем) положило начало лавинообразному росту данных, что при­вело к необходимости пересмотреть отношение к их хранению и управлению. На сегодня предложения, существующие на рынке, существенно заполнили разрыв между уровнями сервисов, которые пред­лагаются дисковыми и ленточными системами.


Распределение данных в рамках одной системы
Распределение данных в рамках одной системы
Уровень сервисов определяет стратегию управления жизненным циклом данных в прак­тическом срезе. Для биз­нес-потребителей (биз­н­ес-процессов или приложений) системы хранения данных представлены в терминах уровня сервисов, которые способны предоставить программно-аппаратные платформы по использованию данных. Такими терминами являются производительность, доступность информации, защита информации и возможность совместного использования накапливаемой компанией информации. Если корректно разработать мно­гоу­ровневые системы и распределить данные по ним в соответствии с требованиями бизнеса, пользователей и приложений, то можно говорить об оптимизации использования ресурсов.

Предоставление сервисов не­об­ходимого уровня для соответствующих данных по минимальной цене можно считать ключом к оптимизации стоимости информационных ресурсов в сочетании с повышением утилизации существующей и накапливаемой информации. В конечном итоге речь идет об оправданной экономии для ресурсов, которым необходим более низкий уровень сервисов, и использовании выделенных бюджетов для критичной информации. При этом следует помнить, что уровни сервисов будут определяться бизнес-требованиями. Например, если база данных диктует требования скорости обработки определенного количества транзакций, то системы хранения данных должны рассчитываться с учетом предоставления нужного уровня производительности. Если регулирующие законы диктуют сроки хранения информации, то необходимо обеспечивать специфические функции архивного хранения, например, ау­тен­тичность архивных данных, возможность доступа в режиме онлайн. Если бизнес-подразделения диктуют сроки восстановления работоспособности приложений, необходима разработка функций, обеспечивающих наличие целостной копии данных на указанные моменты времени.

Практические шаги по применению концепции ILM


табл. 1
табл. 1
Для оптимизации сто­имости ресурсов хранения данных традиционно раз­раба­тываются решения по их консолидации. Опти­мизация затрат главным образом достигается за счет более эффективной утилизации ресурсов при помощи возможности перераспределения неис­пользуемой емкости между под­ключенными системами обработки данных (серверами). На практике для каждого из при­ложений разрабатывается собственная инфраструктура с соответствующими уровнями сервисов по хранению данных. При этом уровень сервисов, пре­доставляемый приложению по отношению ко всем данным, будет одинаков. При изменении бизнес-требований или требований приложений к уровням сервисов по наиболее критичным данным необходимо наращивание мощности и функциональности системы в целом. Учитывая, что данные, которыми оперирует приложение, имеют раз­личную ценность, для критичных данных предлагаемый уровень сервисов может быть слишком низким, в то время как некритичные, устаревшие или избыточные данные используют ресурсы подсистемы, уровень сервисов которой намного выше необходимого.

Общий подход к применению концепции управления жизненным циклом данных на практике будет включать в себя:

1. классификацию данных в соответствии с требуемыми уровнями сервисов;
2. проекцию уровней сервисов на инфраструктурные уровни;
3. активное управление данными в течении их жизненного цикла в соответствии с изменяющимися требованиями по уровню сервисов.


Данные, которыми оперирует приложение, имеют различную ценность
Данные, которыми оперирует приложение, имеют различную ценность
Среда каждой компании, как и данные, которые накапливаются и используются годами, является уникальной. Такой же будет и инфраструктура хранения данных, однако базовые процедуры классификации данных и распределения их по соответствующим уровням помогут реализовать оптимальное решение.

Пример 1.
Оперативное хранение данных


Для удешевления хранения устаревших или архивных данных традиционно использовались ленточные или оптические носители (off-line storage), которые могли находиться в составе роботизированной библиотеки. Устаревшие данные переносились с продуктивной системы на более дешевые носители и могли сохраняться годами. Разрыв между уровнями сервисов оперативных и архивных систем был достаточно большой. В течение последних нескольких лет этот разрыв был заполнен, и сегодня существует богатый выбор систем с большим количеством функциональных возможностей для оптимизации хранения данных.

При разработке системы хранения оперативных данных основными пара­метрами являются производительность и надежность системы (табл. 1).

На практике такая система может быть реализована разными способами.

Способ 1.
Распределение данных по различным системам

Данные распределяются в соответствии с требованиями приложения по разным системам, обладающим соответствующими характеристиками. Под каждый уровень формируется собственный набор функциональных характеристик, своя выделенная среда, происходит оптимизация по стоимости. Критичным элементом такой мно­гоуровневой системы является функция миграции данных между ресурсами разных уровней. В противном случае данные будут заключены в рамках предоставленных им систем, и реализовать динамическую модификацию среды в соответствии с текущими потребностями будет крайне сложно.

Способ 2.
Распределение данных в рамках одной системы


В рамках одной системы формируются разные ресурсы разного уровня в основном за счет использования дисков с различными показателями по производительности и надежности. Такой подход позволяет уйти от дополнительных операционных издержек (по сравнению с предыдущим) и позволит более простое управление. Решение является более гибким в реакции на новые потребности, а также позволяет реализовать более высокий уровень утилизации системы.

Для такого решения необходима возможность установки в рамках одной подсистемы дисков с разными пока­зателями по цене, производительности, надежности и, как и в предыдущем случае, функциональность миграции данных между различными уровнями данных. Существенными преимуществом по уровню сервисов будут обладать системы, позволяющие мигрировать данные между различными физическими дисками в фоновом режиме, без остановки приложений.

Пример 2.
Business Continuity Solutions



На аппаратном уровне существует ряд функций, обеспечивающих необходимый уровень доступности данных. Практическая реализация каждой из таких функций по стоимости будет соответствовать уровню предоставляемого сервиса
На аппаратном уровне существует ряд функций, обеспечивающих необходимый уровень доступности данных. Практическая реализация каждой из таких функций по стоимости будет соответствовать уровню предоставляемого сервиса
Концепция непрерывности бизнеса представляет собой класс решений по обеспечению непрерывности биз­нес-операций и вклю­чает как программно–ап­паратные решения, так и ряд административных мер, позволяющих персоналу обеспечить работу опе­рационной среды. В контексте систем хранения данных решения сводятся к обеспечению необходимого уро­вня доступности и за­щиты данных таким обра­зом, чтобы на момент восстановления операционная среда удовлетворяла целевым показателям по времени и точке восстановления:

Время восстановления (RTO) — время, необходимое для восстановления сервисов приложений, или время недоступности систем.

Точка восстановления (RPO) — допустимые потери данных, определяющиеся моментом времени, на который должна будет “откатиться” система после восстановления.

Кроме этого, для построения инф­рас­труктуры, обес­пе­­чи­ва­ю­щей необходимые уровни сер­висов в срезе непрерывности бизнес-операций, необходимо провести четкий анализ и идентификацию рисков, по противодействию которым принимаются превентивные меры. В том числе необходимо оценить масштаб аварии или катастрофы, для противодействия которой принимаются превентивные меры.


табл. 2
табл. 2
На аппаратном уровне существует ряд функций, обеспечивающих необходимый уровень доступности данных. Практическая реализация каждой из таких функций по стоимости будет соответствовать уровню предоставляемого сервиса. Способ защиты от аварий с физическим разрушением оборудования, когда для быстрого восстановления сервисов требуется дублирование техники, должен быть выбран в соответствии с теми потерями, которые понесет бизнес в случае аварии и с учетом вероятности такой аварии.

Аккуратный анализ рисков и их влияния на бизнес поможет избежать дополнительных затрат на дублирование систем, режим работы которых позволяет разумное время простоя (табл. 2). Возможность эффективного ис­пользования информационных активов по цене, оправданной с точки зрения бизнес-ценности, напрямую зависит от того, насколько тонко осуществляется настройка инфраструктуры хранения и управления информацией. Функциональные возможности доступных на сегодня программно-аппаратных комплексов позволяют реализовать множество решений, связанных с оптимизацией хранения и управления информацией, в то время как мастерство архитектора решения состоит в корректном соотношении бизнес-требований и предлагаемых платформ.

С автором материала Аллой Соболевской, ведущим консультантом компании “S&T Софт-Троник”, можно связаться по адресу:
Alla.Sobolevskaya@snt.ua