В современной бизнес-среде, зависящей от компьютерных систем и возможностей моментальных коммуникаций, информация становится таким же активом, как персонал, денежные средства или бизнес-операции, которыми необходимо управлять. Для продвижения продуктов и услуг в этой области большинство компаний-производителей активно эксплуатируют стратегию “Information Lifecycle Management”, или управление жизненным циклом информации.
Распределение данных по различным системам |
При этом состав и функциональные возможности предлагаемых продуктов охватывают широкий спектр задач и не поддаются классификации или сравнению. По этой причине зачастую специалисты, для которых разрабатываются такие продукты и решения, стоят перед достаточно сложной задачей выбора.
Целью стратегии ILM является предоставление адекватного уровня сервисов по отношению к соответствующим типам данных по оправданной цене. Существует ряд основных понятий и принципов, позволяющих сформировать такую стратегию и определить практическую составляющую понятия ILM.
• Ценность информации определяется бизнесом. В интересах бизнеса информация накапливается и используется в самых разных формах. В зависимости от текущего бизнес-процесса ценность данных может быть выше или ниже. В соответствии с целями, для которых данные необходимы, доступ и наличие последних может иметь критичное для бизнеса значение. Иными словами, данные обслуживают интересы бизнеса, а бизнес-контекст определяет их ценность.
• Ценность данных меняется со временем. Данные могут иметь различную ценность и видоизменяться, равно как со временем может меняться и режим доступа к ним. Неожиданное событие (например, аудит), может влиять на необходимость быстрого доступа к требуемым данным, и тогда данные снова переходят в активное состояние. С течением времени данные могут терять свою ценность и удаляться, но такой период может быть очень длительным. На этом жизненный цикл данных может завершаться. Однако не все создаваемые данные имеют одинаковую ценность и, кроме того, ценность данных со временем меняется.
• Многоуровневые системы хранения данных являются основой систем управления жизненным циклом данных. Одной из основных задач систем является снижение стоимости хранения данных при сохранении необходимого режима их использования. Создание ресурсов хранения данных должно осуществляться с использованием систем, обладающих различными показателями доступности, производительности, функциональности и стоимости в сочетании с распределением данных по таким системам в соответствии с требованиями приложений.
В целом, идея управления жизненным циклом информации существует давно и практически не претерпела изменений. На аппаратном уровне стоимость хранения данных оптимизируется при помощи миграции данных на менее дорогие носители. До недавнего времени эта задача решалась при помощи архивирования устаревших данных на ленточные накопители. Среди основных недостатков необходимо упомянуть сложность, а иногда и невозможность найти необходимые данные в нужный момент.
Существенное удешевления систем оперативного хранения данных (дисковых подсистем) положило начало лавинообразному росту данных, что привело к необходимости пересмотреть отношение к их хранению и управлению. На сегодня предложения, существующие на рынке, существенно заполнили разрыв между уровнями сервисов, которые предлагаются дисковыми и ленточными системами.
Распределение данных в рамках одной системы |
• Предоставление сервисов необходимого уровня для соответствующих данных по минимальной цене можно считать ключом к оптимизации стоимости информационных ресурсов в сочетании с повышением утилизации существующей и накапливаемой информации. В конечном итоге речь идет об оправданной экономии для ресурсов, которым необходим более низкий уровень сервисов, и использовании выделенных бюджетов для критичной информации. При этом следует помнить, что уровни сервисов будут определяться бизнес-требованиями. Например, если база данных диктует требования скорости обработки определенного количества транзакций, то системы хранения данных должны рассчитываться с учетом предоставления нужного уровня производительности. Если регулирующие законы диктуют сроки хранения информации, то необходимо обеспечивать специфические функции архивного хранения, например, аутентичность архивных данных, возможность доступа в режиме онлайн. Если бизнес-подразделения диктуют сроки восстановления работоспособности приложений, необходима разработка функций, обеспечивающих наличие целостной копии данных на указанные моменты времени.
Практические шаги по применению концепции ILM
табл. 1 |
Общий подход к применению концепции управления жизненным циклом данных на практике будет включать в себя:
1. классификацию данных в соответствии с требуемыми уровнями сервисов;
2. проекцию уровней сервисов на инфраструктурные уровни;
3. активное управление данными в течении их жизненного цикла в соответствии с изменяющимися требованиями по уровню сервисов.
Данные, которыми оперирует приложение, имеют различную ценность |
Пример 1.
Оперативное хранение данных
Для удешевления хранения устаревших или архивных данных традиционно использовались ленточные или оптические носители (off-line storage), которые могли находиться в составе роботизированной библиотеки. Устаревшие данные переносились с продуктивной системы на более дешевые носители и могли сохраняться годами. Разрыв между уровнями сервисов оперативных и архивных систем был достаточно большой. В течение последних нескольких лет этот разрыв был заполнен, и сегодня существует богатый выбор систем с большим количеством функциональных возможностей для оптимизации хранения данных.
При разработке системы хранения оперативных данных основными параметрами являются производительность и надежность системы (табл. 1).
На практике такая система может быть реализована разными способами.
Способ 1.
Распределение данных по различным системам
Данные распределяются в соответствии с требованиями приложения по разным системам, обладающим соответствующими характеристиками. Под каждый уровень формируется собственный набор функциональных характеристик, своя выделенная среда, происходит оптимизация по стоимости. Критичным элементом такой многоуровневой системы является функция миграции данных между ресурсами разных уровней. В противном случае данные будут заключены в рамках предоставленных им систем, и реализовать динамическую модификацию среды в соответствии с текущими потребностями будет крайне сложно.
Способ 2.
Распределение данных в рамках одной системы
В рамках одной системы формируются разные ресурсы разного уровня в основном за счет использования дисков с различными показателями по производительности и надежности. Такой подход позволяет уйти от дополнительных операционных издержек (по сравнению с предыдущим) и позволит более простое управление. Решение является более гибким в реакции на новые потребности, а также позволяет реализовать более высокий уровень утилизации системы.
Для такого решения необходима возможность установки в рамках одной подсистемы дисков с разными показателями по цене, производительности, надежности и, как и в предыдущем случае, функциональность миграции данных между различными уровнями данных. Существенными преимуществом по уровню сервисов будут обладать системы, позволяющие мигрировать данные между различными физическими дисками в фоновом режиме, без остановки приложений.
Пример 2.
Business Continuity Solutions
• Время восстановления (RTO) — время, необходимое для восстановления сервисов приложений, или время недоступности систем.
• Точка восстановления (RPO) — допустимые потери данных, определяющиеся моментом времени, на который должна будет “откатиться” система после восстановления.
Кроме этого, для построения инфраструктуры, обеспечивающей необходимые уровни сервисов в срезе непрерывности бизнес-операций, необходимо провести четкий анализ и идентификацию рисков, по противодействию которым принимаются превентивные меры. В том числе необходимо оценить масштаб аварии или катастрофы, для противодействия которой принимаются превентивные меры.
табл. 2 |
Аккуратный анализ рисков и их влияния на бизнес поможет избежать дополнительных затрат на дублирование систем, режим работы которых позволяет разумное время простоя (табл. 2). Возможность эффективного использования информационных активов по цене, оправданной с точки зрения бизнес-ценности, напрямую зависит от того, насколько тонко осуществляется настройка инфраструктуры хранения и управления информацией. Функциональные возможности доступных на сегодня программно-аппаратных комплексов позволяют реализовать множество решений, связанных с оптимизацией хранения и управления информацией, в то время как мастерство архитектора решения состоит в корректном соотношении бизнес-требований и предлагаемых платформ.
С автором материала Аллой Соболевской, ведущим консультантом компании “S&T Софт-Троник”, можно связаться по адресу:
Alla.Sobolevskaya@snt.ua