Авторизация | Регистрация нового пользователя

> > >

Новости ИТ-бизнеса

04.12.2025
Чергова жертва робо-таксі Waymo

04.12.2025
Київстар розширив перелік країн, у яких діє Роумінг як вдома

03.12.2025
Українські хакери атакували інфраструктуру вугільного гіганта РФ

03.12.2025
Vodafone робить «Роумінг як вдома» стандартом у своїх тарифах

03.12.2025
Завдяки системі Antifraud кіберполіція заблокувала масштабну шахрайську транзакцію

Другие новости

Современные решения

Облачные технологии: future continuous для бизнеса

Как настроить шлюз Cisco SPA8800 в среде Asterisk

Что такое Cool-safe?

Другие решения

Інфраструктурні рішення

	Версия для печати
	Версия для печати с изображениями
	Отправить ссылку
	Поместить в блог
	Добавить комментарий
	Написать в редакцию
	Подписаться на рассылки

Будущее Deep Learning — в неконтролируемом обучении

Автор: Сергей Стельмах

31.10.2018

Искусственный интеллект — это одна из самых быстроразвивающихся технологий, но в отличие от других технологий, она время от времени вызывает вопросы, касающиеся путей ее развития, пишет на портале Information Age Питер Уоллес, коммерческий директор британского отделения компании GumGum, занимающейся обучением ИИ компьютерному зрению.

Одним из таких вопросов является влияние ИИ на рынок труда, другим, который возник несколько недель назад, является его предвзятость по отношению к женскому полу. Специалисты по машинному обучению Amazon обнаружили, что ИИ, который обрабатывает резюме кандидатов на должности в компании, дискриминирует женщин-соискателей. Эта особенность не закладывалась в систему умышленно — она явилась результатом глубокого обучения (Deep Learning).

Дело в том, что система проходила обучение на резюме, поступивших в компанию за последние 10 лет. Большая часть этих резюме принадлежала мужчинам, что в целом отражает положение дел в ИТ-отрасли. В результате ИИ Amazon решил, что соискатели-мужчины более предпочтительны, чем женщины. Amazon отредактировала алгоритм, но корректировка не давала гарантий, что он не будет дискриминировать кандидатов по другим признакам, поэтому компания решила отказаться от использования системы.

Проблема Amazon кроется в методах обучения ИИ. На базовом уровне глубокое обучение — это анализ прошлых данных для прогнозирования и понимания будущего, и если он выявляет мезогинию (неприязнь либо укоренившееся предубеждение по отношению к женщинам), ИИ может воспринять ее как норму, что доказывает насколько его «воображение» несовершенно и как многому ему еще предстоит обучиться.

Визуальное распознавание контента в целом и идентификация лиц в частности — одна из таких областей. Последняя технология применяется во все возрастающем количестве приложений, поэтому точность определения зрительных образов сложно переоценить. К примеру, от точности работы биометрических ИИ-платформ распознавания лиц в аэропортах зависит безопасность пассажиров (технология призвана не позволить проникнуть на борт террористу) или допуск к определенным банковским сервисам. Распознавание лиц людей проникает во все сферы общественной жизни, поэтому важно убедиться, что системы глубокого обучения опираются на достоверные данные — логическую надстройку для повышения эффективности бизнеса. Очевидно, что машинное обучение в отрыве от точных данных приведет к искажению картины и навредит бизнесу.

Машинное обучение создано для больших данных

Современный объем генерируемых в мире данных составляет около 2,5 квинтиллиона байтов в день. Учитывая, что эти данные никак не структурированы и не маркированы, они непригодны для контролируемого машинного обучения. Под ним подразумевается обучение ИИ-систем на базе крупных по объему и разрозненных данных — они являются залогом успешности обучения и получения в ближайшем будущем доверительности результатов, тогда как «питание» глубокого обучения малыми порциями ведет к получению предвзятых выводов и «переобучению». Другими словами, порции небольших данные научат машину видеть только деревья, но не древесину.

Простой пример. Если требуется обучить ИИ-сеть распознаванию привлекательных лиц, но применять для этого только фотографии белых людей, то она научится выделять из сонма лиц только их. В прошлом году такая избирательность повредила разработчику приложения FaceApp. Сервис использует нейронные сети, чтобы изменить вид лица на фотографии. Он может добавить улыбку или заставить пользователя выглядеть старше или моложе, но разработчик совершил ошибку, добавив в фотофильтр «Горячий» (он создан для придания лицам большей привлекательности) опцию, которая «отбеливала» лица чернокожих людей.

Контролируемое vs. неконтролируемое (глубокое) обучение

Нейронная сеть во многом напоминает поведение младенца, который по-разному себя ведет, когда он находится под присмотром или предоставлен самому себе. Если за ним не приглядывать и ничему не обучать, он все равно будет узнавать что-то новое, но это будет происходить непредсказуемым образом. Как можно догадаться, обучаемая таким образом нейронная сеть станет неконтролируемой. Тем временем контролируемое обучение (обучение с учителем) предусматривает принудительное обучение с помощью примеров или обучающих выборок. В случае с обучением распознаванию образов нейронной сети предлагают идентифицировать визуальный контент начиная с фотографий и заканчивая видео и графикой при помощи определенных меток и тегирования.

Пикселизация/распознавание образов — когда-то узкопрофильное направление обучения нейронных сетей переросло эти рамки и теперь они, как правило, проходят контролируемое обучение и добились в этом ремесле вершин точности, недостижимой для человеческого глаза. Может показаться, что неконтролируемое обучение ИИ не имеет смысла, однако это не так. Предоставляя глубокому обучению творческую свободу — хаотическое потребление данных, поиск шаблонов, установку связей, выявление контекста — можно рассчитывать на то, что это приведет к неожиданным результатам.

Пока что глубокое обучение несравнимо хуже по качеству работы в сравнении с контролируемым, но нужно понимать, что эта технология делает первые шаги. В перспективе она научится распознавать образы, обходясь без специальных маркировок. Это в итоге приведет к тому, что обучение нейронных сетей не будет ограничиваться лишь существующими наборами данных, более того, ИИ-сети вообще не будут на них полагаться.

ИИ нужно больше свободы

Как уже говорилось, ИИ — топовая технология, поэтому разработчики неустанно пополняют ее закрома большим количеством моделей обучения, однако большая часть из них непригодна для использования в глубоком обучении. Пока что это только предположение, но, возможно, будущее глубокого обучения кроется в неконтролируемом обучении. Почему? Потому что вначале родители помогают детям сделать первые шаги, но затем они все постигают самостоятельно, учась на своем опыте и ошибках.

Таким образом, развитие глубокого обучения зависит от постоянного пополнения этих систем качественными, разнообразными, структурированными и маркированными данными, чтобы они получали полноценное, а не однобокое представление о мире и могли вывести объективные и логические результаты. Однако не стоит забывать о другой стороне глубокого обучения сетей, сдвигая фокус с их тренировки с помощью данных в сторону неконтролируемых методов обучения, то есть они должны не просто анализировать информацию, но и подражать поведению людей, учиться мыслить так же, как они.

Поместить в блог

<table border="0" width="75%" style="margin:10px; border:2px solid #036; background-color:#FFF;"><tr><td align="right"><a href="http://www.pcweek.ua" target="_blank"><img src="http://www.pcweek.ua/images/pcweek/logo-blog.gif" style="width:100px; height:30px; border:0;" alt="PC Week/UE"></a></td></tr><tr><td><a href="http://www.pcweek.ua/themes/detail.php?ID=157598" target="_blank"><img src="http://www.pcweek.ua/upload/iblock/3c2/mo70.jpg" alt="Открыть материал" style="width:70px; height:50px; border:1px solid #000; float:left; margin:0 5px 5px 0;"></a><a href="http://www.pcweek.ua/themes/detail.php?ID=157598" target="_blank" style="font:14px Arial; color:#000; text-decoration:none; font-weight:bold;">Будущее Deep Learning — в неконтролируемом обучении</a><br><a href="http://www.pcweek.ua/themes/detail.php?ID=157598" target="_blank" style="font:12px Arial; color:#000; text-decoration:none;">Современный объем генерируемых в мире данных составляет около 2,5 квинтиллиона байтов в день. Учитывая, что эти данные никак не структурированы и не маркированы, они непригодны для контролируемого машинного обучения...</a></td></tr><tr><td align="right"><a href="http://www.pcweek.ua/themes/detail.php?ID=157598" target="_blank" style="font:12px Arial;">Открыть материал</a></td></tr></table>

Комментарии к статье

Статьи по теме

Початок ери 128-гігабітного Fibre Channel

Минулого тижня корпорація Broadcom оголосила про старт постачання перших продуктів для мереж зберігання даних (SAN), що використовують технологію Fibre Channel 8-го покоління зі швидкістю передачі даних 128 Гбіт/с.

Hitachi Vantara представила флагманську систему зберігання даних VSP One Block High End

Максимальна конфігурація включає 12 контролерів та 288 накопичувачів NVMe TLC по 60 ТБ (можливе встановлення дисків ємністю від 1,9 до 30 ТБ). Кожна пара контролерів займає модуль висотою 4U, а диски розміщуються...

Cisco анонсувала нове рішення для розподілених обчислень ШІ

Нове рішення дає змогу розміщувати поруч із задачами ШІ (зокрема, інференсом у реальному часі та ШІ-агентами) необхідні обчислювальні потужності, сховища даних і мережеве обладнання.

D-Link виводить на ринок нову точку доступу Wi-Fi 7

DAP-E9560 працює в трьох частотних діапазонах — 2,4, 5 і 6 ГГц, з шириною каналу 320 МГц, що дозволяє досягати загальної швидкості бездротової передачі даних до 9500 Мбіт/с. Зокрема, швидкість у діапазоні 6 ГГц становить 5764 Мбіт/с...

Zyxel представив точку доступу WiFi 7 для промислових застосувань

Пристрій розрахований на роботу при температурах від −25 до +65 °C і вологості 10–90 %, оснащений подвійним живленням, портом 2.5GbE, двома зовнішніми антенами та металевим корпусом.

Форум

Наступило время экспериментов (Noname, 08.04.2016 09:45:00)

Укртелеком в 4 раза снижает стоимость звонков на мобильные (СЕргей, 06.04.2016 19:11:59)

Укравтодор отмечает дорожные работы и перекрытия на Яндекс.Картах (Noname, 05.04.2016 17:30:44)

Яндекс.Карты объявляют конкурс для киевлян (Хтось, 17.02.2016 12:24:08)

Информационная безопасность: в поисках совершенной защиты (Лариса Ершова, 09.11.2015 18:39:47)

Другие темы

Газета PC Week Ukrainian Edition печатается по лицензионному соглашению с компанией Ziff Davis Publishing Inc. Перепечатка материалов допускается только c разрешения редакции. За содержание рекламных объявлений редакция ответственности не несет. Editorial items appearing in PC Week/UE that were originally published in the U.S. edition of PC Week are the copyright property of Ziff Davis Publishing Inc. Copyright 2015 Ziff Davis Inc. All rights reserved. PC Week is trademark of Ziff Davis Publishing Holding Inc.
© 2025 ООО “ПИСИВИК УКРАИНА”. Информация об авторских правах и порядке использования материалов сайта