Сейчас у всех на на слуху термины Искусственный интеллект (ИИ), машинное обучение и глубокое обучение… В чем их отличие? В этих терминах сегодня путаются многие специлисты, поэтому имеет смысл разъяснить суть технологий.
Искусственный интеллект (AI, Artificial Intelligence) означает, что компьютер тем или иным образом имитирует поведение человека.
Глубокое обучение (DL, Deep Learning) является подмножеством машинного обучения, и оно дает компьютерам возможность решать более сложные задачи.
Все эти описания корректны, но довольно лаконичны. Поэтому стоит рассказать о каждой из областей подробнее.
Что такое ИИ?
Искусственный интеллект как академическая дисциплина появился в 1956 году. Цель, как и сейчас, тогда заключалась в том, чтобы заставить компьютеры решать задачи, которые считались подвластными исключительно людям: те, что требовали интеллекта. Первоначально исследователи работали над такими задачами, как игра в шашки и решение логических головоломок.
Взглянув на результаты одной из таких программ игры в шашки, можно было увидеть за их ходами какую-то форму «искусственного интеллекта», особенно когда компьютер вас побеждал. Первые успехи вызвали у исследователей почти безграничный энтузиазм по поводу потенциала ИИ, который однако не соответствовал тому, насколько сложными могли оказаться решения отдельных задач.
Искусственный интеллект: этапы развития
Искусственный интеллект, следовательно, относится к выводам компьютера. Компьютер делает что-то «умное», поэтому он демонстрирует интеллект, интеллект искусственный.
Сам термин «ИИ» ничего не говорит о том, как именно эти задачи решаются. Между тем существует множество различных методов, в том числе основанных на правилах или экспертных системах. И одну категорию методов стали особенно широко использовать в 1980-х годах – машинное обучение.
Что такое машинное обучение?
Причина, по которой первые исследователи столкнулись с тем, что некоторые задачи на самом деле оказались намного сложнее, чем представлялось ранее, состоит в следующем: эти задачи просто не поддаются решению ранними методами, используемыми в ИИ. Жестко закодированные алгоритмы или фиксированные, основанные на правилах системы не очень хорошо работают с такими вещами, как распознавание изображений или понимание текста.
Решением оказалось не просто подражание человеческому поведению, а имитация того, как люди учатся.
Подумайте о том, как вы освоили чтение. Вы ведь не садились изучать орфографию и грамматику, прежде чем прочесть свою первую книгу. Вы сначала читаете простые книги, которые со временем становятся все более сложными. Вы действительно изучили правила (и исключения) орфографии и грамматики – но в процессе чтения. Иными словами, вы обработали много данных и научились на них.
Именно в этом и состоит идея машинного обучения. Дать алгоритму (в отличие от мозга) огромное множество данных и позволить ему сделать заключения. Снабдите алгоритм большим количеством данных о финансовых транзакциях, укажите, какие из них являются мошенническими, и дайте ему понять, что именно говорит о мошенничестве, чтобы он мог прогнозировать такие злоупотребления. Или дайте информацию о своей клиентской базе и позвольте ему сделать вывод, как лучше ее сегментировать.
Идея использования искусственных нейронов (а нейроны, связанные посредством синапсов, являются основными элементами нашего мозга) была известна довольно давно, и нейронные сети, смоделированные в программном обеспечении, стали использовать для решения определенных задач. Подход оказался многообещающим и позволил решить некоторые сложные задачи, с которыми не справлялись другие алгоритмы.
Но машинное обучение все еще ограничивалось тем, с чем легко справлялись младшие школьники: сколько собак на этой картине или не волки ли это на самом деле? Идите туда и принесите мне спелый банан. Что заставило героя этой книги так много плакать?
Оказалось, что проблема – вовсе не в самой концепции машинного обучения. И даже не в идее подражать работе человеческого мозга. Простые нейронные сети с сотнями или даже тысячами нейронов, связанные относительно простым способом, не могли дублировать то, на что способен человеческий мозг. Если подумать, то это вовсе не удивительно: в человеческом мозгу насчитывается около 86 миллиардов нейронов и имеют место очень сложные взаимосвязи.
Что такое глубокое обучение?
И когда вы читаете о достижениях в области вычислений –- от автономных автомобилей до суперкомпьютеров, играющих в Go, и систем распознавания речи, то знайте, что в основе всего этого лежит глубокое обучение. Вы имеете дело с некоей формой искусственного интеллекта. И этот ИИ использует определенную форму глубокого обучения.
Давайте рассмотрим пару задач, чтобы понять, чем глубокое обучение отличается от более простых нейронных сетей или иных видов машинного обучения.
Как работает глубокое обучение
Если вам покажут изображение лошадей, вы узнаете в них лошадей, даже если вы никогда этой картинки раньше не видели. И не важно, лежит ли лошадь на диване или наряжается на Хэллоуин в бегемота. Вы сможете узнать лошадь, потому что вы знаете о различных элементах, которые определяют лошадь: форму ее головы, количество и расположение ног и т.д.
Глубокое обучение как раз и способно это сделать, что очень важно для многих областей, включая автономные транспортные средства. Прежде чем автомобиль без водителя сможет определить свое следующее действие, ему нужно знать, что его окружает. Он должен уметь распознавать людей, велосипеды, другие транспортные средства, дорожные знаки и многое другое. И делать это в сложных для визуальных задач условиях. Стандартные методы машинного обучения не могут этого сделать.
Возьмите обработку речи на естественном языке, которая используется сегодня в чатботах и голосовых помощниках смартфонов (это лишь пара примеров). Рассмотрим данное предложение и посмотрим, какова должна быть последняя часть:
Я родился в Италии и, хотя большую часть своей жизни прожил в Португалии и Бразилии, все еще свободно говорю на ________.
Надеюсь, вы видите, что наиболее вероятным ответом является на итальянском языке. Но подумайте о том, что требуется, чтобы прийти к такому заключению.
Для начала нужно знать, что недостающее слово – это язык. Это можно сделать, если понимать фразу «я свободно говорю ... ». Чтобы получить «итальянский», вы должны вернуться к этому предложению и проигнорировать слова о Португалии и Бразилии. «Я родился в Италии» подразумевает изучение итальянского языка, пока ребенок растет (с вероятностью 93%, согласно Википедии). Предполагается, что вы понимаете то, что следует за рождением, а это выходит далеко за рамки того дня, когда вы появились на свет. Сочетание слов «хотя» и «все еще» дает понять, что речь идет не о португальском и возвращает вас в Италию. Поэтому «итальянский» – самый вероятный ответ.
Представьте, что происходит в нейронной сети вашего мозга. Когда вы обдумываете какие-то вещи, такие факты, как «рождение в Италии» и «хотя ... все еще» являются исходными данными для других областей вашего мозга. И этот принцип переносится на глубокие нейронные сети через сложные обратные связи.
Заключение
- Искусственный интеллект – любой метод, позволяющий имитировать поведение человека.
- Машинное обучение – любые методы, которые позволяют учиться, не будучи явно запрограммированными на это.
- Глубокое обучение – подмножество машинного обучения, использующее подходящие многослойные нейронные сети.
Если вы готовы начать свое знакомство с машинным обучением, попробуйте бесплатно Oracle Cloud и создайте собственное озеро данных, чтобы проверить некоторые из перечисленных выше методов на практике.