ИТ-инфраструктура современной организации представляет собой сложную систему, управление которой превращается в нетривиальную задачу. Важнейшими составляющими управления являются мониторинг, управление производительностью (Performance Management) и планирование ИТ-ресурсов (Capacity Management).

В компаниях со сложной инфраструктурой интерес к системам мониторинга постоянно растет.  Ведь главная задача, стоящая перед любым ИТ-подразделением — не допустить сбоев и простоев в работе критических для бизнеса сервисов, минимизировать риски по поддержанию эксплуатационной готовности существующих ИТ-систем, адаптировать их к условиям быстро развивающегося бизнеса.

Использование современных средств автоматизации для обнаружения и контроля событий в большей мере решает эти и другие задачи, открывает широкие возможности для улучшения качества предоставляемых сервисов ИТ-департаментом.

Комплексный характер бизнес-приложений требует четко прописать все взаимосвязи, чтобы предсказывать возникновение проблемных ситуаций можно было бы заранее. Конечно, определенные прогнозы можно строить исходя из информации в журналах работы реактивных систем мониторинга, но вряд ли у сотрудников компании найдется достаточно времени на ее анализ.

В условиях стремительного развития информационных технологий и требований к их производительности, большую популярность получили системы проактивного мониторинга. Использование подобных систем позволяет организации фиксировать и осуществлять предупреждающий анализ доступности, состояния и производительности сетевого оборудования, программно-аппаратного комплекса, информационных сервисов, оптимизировать их загрузку, а также прогнозировать возникновение нештатных ситуаций. Благодаря системам появляется возможность не только серьезно сократить число критических сбоев, повысить эффективность работы информационной инфраструктуры, но и в значительной степени снизить нагрузку на обслуживающий ИТ-персонал.

Системы проактивного могиторинга на основе анализа полученных данных способны предсказывать возможные сценарии поведения объекта наблюдения. Практически всегда в таких системах точность прогнозирования зависит от времени, в течение которого система накапливает статистические данные. Система «понимает» логику приложения, умеет анализировать его журналы, состояние окружения. Она контролирует различные показатели, выстраивает взаимосвязи между сервисами. Но, несмотря на постоянное технологическое совершенствование систем мониторинга, даже самые современные из них нуждаются в конфигурировании для работы в конкретной среде, для выполнения конкретных задач. То есть систему в первую очередь необходимо «обучилась».  Для этого нужно определить перечень объектов, которые будут охвачены системой мониторинга, определить основные параметры объектов, по которым система сможет распознавать и контролировать их работу. Ведь если процессом обучения пренебречь, система не разберет, какие из неполадок влияют на качество функционирования бизнес-процесса значительно, а какие нет.  

Также, необходимо сформировать список ключевых бизнес-процессов, определить, какие ИТ- сервисы оказывают на эти процессы наибольшее влияние и каким образом ИТ-ресурсы взаимодействуют между собой при реализации этих сервисов.

 Правильно настроенная система мониторинга способна эффективно находить узкие места в цепочке предоставления ИТ-сервисов, повышать эффективность управления, использовать объективные источники информации для планирования затрат на покупку новых компонентов ИТ- инфраструктуры, снижать риски при изменениях конфигурации при увеличении числа пользователей, внедрении новых приложений и т.д.

Некоторые задачи, решаемые системами:

·         сбор и обработка информации о производительности ИТ компонентов (серверы, приложения, сетевое оборудование, сервисы), оценка текущей загрузки компонентов ИТ-инфраструктуры;

·         моделирование и анализ действующий ИТ инфраструктуры;

·         мониторинг ключевых показателей производительности;

·         анализ и прогнозирование различных сценариев изменения ИТ инфраструктуры.

 

Пример: Мониторинг в системе управления HP Open View

Однако внедрение системы мониторинга еще не подразумевает организацию слаженной работы внутри ИТ подразделения, с целью своевременного принятия решений и эффективного реагирования на любые изменения в работе отдельных ИТ компонентов или информационных сервисов.

Система мониторинга состоит из организационной и технической составляющей, и предназначена для унификации процессов, процедур и регламентов, а также технических средств мониторинга и контроля всех компонентов вычислительной инфраструктуры организации и объединения их в единую систему управления.

Процесс мониторинга компонентов ИТ-инфраструктуры достаточно сложен с точки зрения процессов и технологически. На первый взгляд, система мониторинга с максимальной детализацией отслеживает работоспособность компонентов ИТ-инфраструктуры, предоставляет актуальную информацию об  их состоянии. Чего не хватает, и что еще нужно? Почему внедрение функциональных, зачастую недешевых систем не приводит к желаемому результату?

Для этого необходимо ответить на несколько важных вопросов.

Как добиться качественной работы системы мониторинга?

Качественная работа сервиса достигается при организации слаженной работы специалистов внутри ИТ-подразделения, что дает возможность оперативно реагировать на сбои и минимизировать их негативное влияние на информационные сервисы. А для этого необходимо описать и регламентировать процесс мониторинга, то есть определить  состав, содержание и последовательность действий, в рамках выполнения отдельных процедур по обработке события, распределить ответственность, полномочия и порядок взаимодействия участников процесса, а также определить информационные потоки и обратные связи для оценки результативности и корректировки деятельности. Для контроля исполнения и результативности процесса необходимо определить показатели качества и метрики.

Кто гарантирует качество ИТ-сервиса? Кто ответственный?

В рамках процесса мониторинга организовывается совместная работа сотрудников и руководителей ИТ-подразделений. Каждый из участников процесса обладает своим набором полномочий и обязанностей, т.е. играет свою роль в процессе. Пример возможной ролевой  структуры процесса приведен на рисунке:

Владелец процесса определяет цели и задачи процесса, и контролирует их исполнение. Владелец процесса также посредством установления политик определяет принципы управления процессом, границы процесса, принципы организации работ и взаимодействия в рамках процесса связь с другими процессами, в частности с Управлением Инцидентами.

Менеджер процесса выполняет оперативное управление процессом, организовывает планирование системы мониторинга (с помощью Аналитиков), планирование и контроль работ по описанию объектов и дерева сервисов, проведение сверок, формирует отчетность по процессу и оказывает содействие Владельцу процесса в принятии управленческих решений. Менеджер процесса отвечает за контроль актуальности конфигурации параметров объектов в системе мониторинга.

Оператор системы мониторинга непосредственно работает с системой мониторинга, реагирует на события, поступающие на консоль системы мониторинга.

Специалист разрешает события, эскалированные на него операторами системы мониторинга.

Аналитики, фактически ответственные за ИТ- системы или комплексы,  определяют конфигурацию системы мониторинга (контур системы, паспорта (детальную информацию о параметрах) объектов, дерево сервисов), готовят сценарии реагирования и инструкции для операторов по обработке событий.

Теперь вы убедились в том, что процесс мониторинга не столь тривиален, как может показаться на первый взгляд. А кто обещал, что будет легко?!

 

Как оптимизировать работу так, чтобы ИТ служба тратила минимум ресурсов и времени для разрешения сбоев в информационной системе?

 

В рамках системы мониторинга необходимо организовать еще и процесс управления событиями, являющийся частью общей системы мониторинга. Эти две области очень близки, а на практике представляют собой два неотъемлемых компонента одной общей и эффективной системы.

Управление событиями – организация и контроль деятельности по разрешению событий, возникающих в ИТ-среде.

Мониторинг – процесс систематического сбора информации о параметрах объектов ИТ инфраструктуры. Например, система мониторинга проверяет состояние объектов мониторинга на предмет их функционирования в допустимых пределах, даже если объект не генерирует никаких событий.

Кроме этого, стоит уделить особое внимание процедурам планирования и контроля функционирования системы и процесса в целом. Ведь именно этими шагами можно определить, что и как мониторить, чем управлять. 

В связи с широким применением средств автоматизации, по нашему опыту, является логичным связать систему мониторинга ИТ инфраструктуры с системой поддержки пользователей (Service Desk) для автоматической регистрации инцидентов, проведения изменений, регламентных работ, оповещения персонала первой и последующих линий поддержки сервисов о других событиях, значимых для бесперебойного функционирования ИТ сервисов.

Итак, для построения процесса мониторинга необходимо описать процесс, четко определить цели и задачи процесса, охват и контур системы мониторинга, определить объекты и параметры, распределить роли и ответственность за работоспособность сервиса. Для контроля исполнения и результативности процесса нужно обозначить показатели качества и метрики.

Можно ли внедрить систему без дополнительных знаний?

Внедрение средств автоматизации ИТ-инфраструктуры и проектирование процессов основывается на использовании лучших практик ведущих компаний с мировым именем, рекомендаций институтов (библиотеки ITIL, стандарт COBIT, ISO/IEC 20000),  и методологий производителей программного и аппаратного обеспечения (IBM Tivoli Unified Process, MOF и т.д.).

Немаловажен и опыт консультанта, который сможет указать на подводные камни, создать гибкое и функциональное решение под конкретного заказчика, спроектировать работоспособный процесс управления ИТ.