Уровень укомплектованности штата в отделах ИТ-операций (ITOps) невысок или снижается, корпоративная ИТ-среда усложняется с каждым днем, а переход в облака ускоряется. В то же время объем данных, генерируемых системами мониторинга и оповещения, стремительно растет, и операционные команды вынуждены реагировать на инциденты еще быстрее.

Столкнувшись с этими проблемами, компании все чаще обращаются к AIOps (Artificial Intelligence for IT Operations) — использованию машинного обучения и искусственного интеллекта для анализа больших объемов данных об ИТ-операциях, чтобы помочь их автоматизировать и оптимизировать. Напомним, что AIOps — термин, введенный аналитической компанией Gartner для описания того, каким образом средства ИИ могут применяться для автоматической идентификации возникающих проблем и их устранения.

Однако прежде чем инвестировать в новую технологию, лидеры хотят быть уверены, что она действительно принесет пользу конечным пользователям, клиентам и бизнесу в целом.

Руководители, которые хотят измерить преимущества AIOps и построить KPI как для ИТ, так и для бизнес-аудитории, должны сфокусироваться на таких ключевых факторах, как время безотказной работы, время реагирования на инциденты и на их устранение, а также предиктивное обслуживание, чтобы предотвратить потенциальные перебои в работе, влияющие на сотрудников и клиентов.

Бизнес-KPI, связанные с AIOps, включают в себя производительность сотрудников, удовлетворенность клиентов и метрики веб-сайта, такие как конверсия или лидогенерация. В итоге, AIOps может помочь компаниям сократить расходы на ИТ-операции за счет автоматизации и быстрого анализа; а также поддержать рост доходов, позволяя бизнес-процессам работать бесперебойно и обеспечивая превосходный пользовательский опыт.

Ниже приведен набор KPI для AIOps.

1. Среднее время обнаружения (MTTD)

Данный KPI отражает то, как быстро удается идентифицировать проблему. AIOps может помочь компаниям путем использования машинного обучения для обнаружения закономерностей, блокировки шума и выявления неисправностей. В условиях лавины оповещений AIOps может понять важность и масштаб проблемы, что приводит к более быстрой идентификации инцидента, сокращению времени простоя и улучшению производительности бизнес-процессов.

2. Среднее время подтверждения (MTTA)

Как только проблема будет обнаружена, ИТ-команды должны ее признать и определить, кто будет ее решать. AIOps может использовать машинное обучение, чтобы автоматизировать процесс принятия решения и быстро убеждаться, что нужные команды работают над проблемой.

3. Среднее время восстановления (MTTR)

Когда основной бизнес-процесс или приложение падает, ключевым моментом является быстрое восстановление сервиса. AIOps с помощью машинного обучения помогает понять, была ли проблема замечена ранее, и, основываясь на прошлом опыте, порекомендовать наиболее эффективный способ восстановления сервиса.

4. Доступность сервиса

AIOps может помочь повысить доступность сервиса, часто формулируемую в процентах времени безотказной работы за определенный период времени или в минутах простоя за определенный период времени, за счет применения прогностического обслуживания.

5. Соотношение автоматизированного и ручного разрешения проблем

Организации все чаще используют интеллектуальную автоматизацию для решения проблем без ручного вмешательства. Модели машинного обучения могут быть обучены выявлять закономерности, такие как предыдущие сценарии, задействованные для решения проблемы, и занять место человека-оператора.

6. Автоматический мониторинг вместо ручного обнаружения

ITOps должны иметь возможность обнаружить и устранить проблему еще до того, как конечный пользователь о ней узнает. Например, если производительность приложения или веб-сайта замедляется на миллисекунды, то должно поступить предупреждение, чтобы исправить проблему до того, как замедление усилится и повлияет на пользователей. AIOps позволяет использовать динамические пороги для автоматической генерации предупреждений и их направления правильной команде для расследования или автоматического исправления согласно установленным политикам.

7. Экономия времени и связанная с этим экономия затрат

Использование AIOps для автоматизации или более быстрого выявления и решения проблем приведет к экономии времени оператора и времени бизнеса. Это напрямую влияет на конечный результат.

Подводя итог

Эти KPI могут быть соотнесены с бизнес-KPI, связанными с пользовательским опытом, производительностью приложений, удовлетворенностью клиентов, улучшением электронных продаж, продуктивностью сотрудников и увеличением доходов. Если команды ITOps смогут быстро устанавливать взаимосвязи между инфраструктурными и бизнес-показателями, то ИТ-отдел получит возможность приоритизировать расходы и усилия на реальные потребности бизнеса. Будем надеяться, что по мере развития машинного обучения инструменты AIOps смогут порекомендовать способы улучшения результатов бизнеса или дать представление о том, почему цифровые программы преуспевают или отстают от графика.


Источник: ITWeek