Нынче самым модным словосочетанием среди руководителей организаций стал искусственный интеллект (ИИ), но переход к этой технологии отнюдь не очевиден и не прост, даже для тех, кто участвует в разработке наиболее продвинутых продуктов и платформ. У многих организаций пока плохо получается даже включить управление данными в процесс собственной цифровой трансформации, так как же им справиться еще и с этой новой задачей?

Недавно в Европе состоялась серия интересных мероприятий, в том числе конференции Big Data Spain в Мадриде и GOTO в Берлине. Обе конференции почтили своим присутствием известные отраслевые деятели и представители ключевых организаций, обе конференции посетило большое количество людей (порядка тысячи участников на каждой), при этом оба мероприятия были прекрасно организованы и были посвящены прогрессивным тематикам.

К тому же на обеих конференциях очень живо освещались вопросы внедрения ИИ в ежедневный уклад жизни технических специалистов и бизнесменов, что отразилось на программе мероприятий и было заметно по интересу, проявленному к выступлениям на тему ИИ.

Тем не менее, для большинства ИИ остается понятием трудноуловимым и малопонятным. Что же такое ИИ, с какой стороны к нему подойти и для чего он нужен с практической точки зрения?

На сегодняшний день средства аналитики получили широкое распространение, они довольно хорошо изучены и успешно применяются во многих организациях. Так что, возможно, именно они могут послужить неплохим отправным пунктом для организаций, желающих вступить на путь внедрения ИИ, считает Рамкумар Равичандран, директор Visa по аналитике и A/B-тестированию.

От данных к аналитике, а позже — к ИИ

Согласно классификации Gartner, аналитике присуща некая цепочка развития, первое звено которой составляют инструменты наглядного отображения, далее следуют средства диагностики и прогнозирования и замыкает цепочку высшее звено — предписывающая аналитика. Многие организации все еще находятся на стадии наглядного отображения, в которой применяются более или менее традиционные подходы к бизнес-аналитике: все данные собираются воедино, а затем с помощью средств визуализации по этим данным судят о сложившейся ситуации.

Диагностическая аналитика призвана разобраться в причинах конкретного события. В ней применяются такие техники, как углубленная детализация, обнаружение данных, поиск закономерностей в данных (data mining) и корреляция. Большая часть аналитических платформ встраивает эти возможности в свои продукты и сервисы.

Но по-настоящему эта тема становится интересной, если средствами прогнозной аналитики попытаться предсказать то, что будет происходить в будущем. Обычно это происходит путем отработки прогнозных моделей машинного обучения (machine learning, ML) на существующих данных. Именно по этой причине Равичандран считает, что аналитика — это ступень в эволюции, ведущей к ИИ.

Ключевые вопросы здесь следующие: состоит ли ИИ в формулировании прогнозов с помощью машинного обучения и является ли внедрение аналитики обязательным для этого условием.

ИИ-решения разрабатывались и использовались задолго до появления аналитики. Примером могут служить экспертные системы, которые годами применяются с разной степенью успешности в таких сферах, как медицина и сельское хозяйство, причем применяющие их организации могут даже не догадываться об аналитике как таковой.

Поэтому ИИ-специалистам мнение о том, что аналитика является необходимым условием для ИИ, может сперва показаться странным. Но при этом стоит учитывать разные сопутствующие факторы: в традиционных ИИ-системах базы знаний обычно формируются и отбираются на основе привлеченных со стороны экспертных знаний, и их считают истиной в последней инстанции.

У современных же организаций имеется масса источников данных с разной степенью надежности: эти источники могут друг другу противоречить, причем объем данных и скорость их получения и обработки также могут отличаться.

Поэтому для тех, кто работает в сфере аналитики, путь от аналитики к ИИ кажется естественным и прагматичным шагом вперед, да и все, что касается фильтрации данных, их надежности, местонахождения и интеграции в самом деле представляет с их точки зрения необходимое условие для ИИ.

Трудности с машинным обучением

Прежде чем разбираться, является ли машинное обучение сутью ИИ, давайте на минутку задумаемся, как заставить ML действительно заработать. У всех на слуху дефицит специалистов по обработке данных, а также разнообразие и редкость их знаний и умений; к тому же далеко не так просто сплотить весь персонал, задействованный в ML-проектах, вокруг четко обрисованного выгодного предложения.

Как известно любому бывалому инженеру, самое главное — это не как строить, а что строить: важно создавать что-то правильное и нужное.

Канва машинного обучения (Machine Learning Canvas, MLC) — это инструмент, разработанный Луи Дораром, сооснователем серии конференций papis.io. Она нужна для того, чтобы у людей, совместно работающих над ML-проектом, было ясное, общее представление о проекте, о его целях и средствах достижения этих целей. Этот инструмент создан по образу и подобию известной методики канвы бизнес-модели; он охватывает целый ряд аспектов, начиная с формулировки миссии и заканчивая источниками данных и заложенными возможностями. Концепция MLC призвана помочь коллективу специалистов выбрать правильный алгоритм, инфраструктуру и конкретное ML-решение перед непосредственной реализацией проекта, а также направлять в нужное русло управление этим проектом.

Но даже несмотря на то, что инструменты вроде MLC могут помочь коллективам разнопрофильных сотрудников объединить свои усилия для совместной работы, они все же не могут разобраться с целым набором проблем, связанных с ML-проектами. Ветераны отрасли уже предложили варианты решения этих проблем и соответствующий арсенал технологий для автоматизации ML, но несмотря на ультрасовременный статус этих процессов разработки для их применения требуется высокий уровень компетенции в широком диапазоне технологий, поэтому для большинства это по-прежнему темный лес.

Как заметили сотрудники Google, работающие над ML-проектами повышенной сложности, в таких проектах трудно искать ошибки, вносить пошаговые изменения и проверять их; сложно понять суть и предназначение алгоритмов, сложно обособить отдельные компоненты; автоматическая интеграция несет в себе нестандартные риски, из-за чего конечном итоге быстрее накапливается технический долг по проекту.

В настоящее время известных решений этих проблем не существует, но акцентирование внимания на них — это уже шаг в нужном направлении. В дальнейшем мы продолжим искать способы справиться с некоторыми из этих проблем, а также прорабатывать вопросы взаимосвязи между ML, данными, метаданными и последними достижениями в области глубинного обучения и ИИ.