Дослідження та розробки

	Версия для печати
	Версия для печати с изображениями
	Отправить ссылку
	Поместить в блог
	Добавить комментарий
	Написать в редакцию
	Подписаться на рассылки

Искусственный интеллект идентифицирует программиста по «почерку»

Автор: Сергей Стельмах

15.08.2018

Специалисты в области стилометрии (исследование стилистики, включающее статистический анализ) хорошо знают, что письмо — это уникальный процесс. Словарный запас, синтаксис и грамматика создают индивидуальный почерк, позволяя определить автора текста. Существуют даже автоматизированные системы, способные идентифицировать человека, написавшего сообщение в Интернете. А недавнее исследование показало, что стилометрию можно применить и к искусственным языкам, например языкам программирования.

Исследователи Рэйчел Гринстадт из Дрексельского университета и Айлин Калискан из Университета Джорджа Вашингтона рассказали на конференции DefCon, что код, как и другие формы стилистического выражения, не является анонимным и его можно распознать. Ученые использовали машинное обучение для выявления авторов образцов кода.

Для тестирования алгоритма использовалась база исходных кодов с ежегодного конкурса Google Code Jam. В ней присутствуют фрагменты, наиболее сильно отличающие программистов друг от друга. Это позволяет уменьшить количество претендентов с сотен тысяч до десятков человек. Изучив работы 100 программистов, искусственный интеллект распознал 96% авторов, используя по восемь примеров кода от каждого разработчика. В случае с исходниками 600 участников конкурса точность распознавания составила 83%.

Ученые считают, что результаты их работы могут быть использованы для выявления случаев недобросовестного заимствования кода. Например, преподаватели технических вузов получат возможность проанализировать код, предоставленный студентами-программистами, и с большой долей уверенности сказать, написан ли он самостоятельно или позаимствован из чужих работ.

Софтверные компании смогут контролировать соблюдение сотрудниками-программистами условий контракта, чтобы избегать случаев, когда уволившиеся работники используют наработки, ранее перешедшие в собственность компании, в сторонних проектах. Специалисты сферы информационной безопасности также нашли бы применение технологии — определить разработчика вредоносного ПО при помощи подобной системы ИИ стало бы намного легче.

Однако могут пострадать разработчики, которые регулярно вносят свой вклад в развитие свободного программного обеспечения, поскольку утратят возможность сохранять анонимность. Как выяснилось, обфускация (намеренное запутывание) исходного кода не слишком помогает в деле сохранения анонимности — даже после такой обработки код сохраняет уникальный авторский «отпечаток». «Люди должны понимать, что не существует гарантированного способа скрыть личность в подобного рода ситуациях», — отметила Гринстед.

Ученые также надеются, что в будущем им удастся получить ответы на многие интересующие их вопросы, например, какие факторы влияют на стиль программирования, что происходит, когда члены одной команды работают вместе над проектом, отличаются ли стили программирования людей из разных стран и т. д. К слову, уже на данном этапе их алгоритм смог различить образцы кода канадских и китайских программистов с точностью более 90%.

Поместить в блог

<table border="0" width="75%" style="margin:10px; border:2px solid #036; background-color:#FFF;"><tr><td align="right"><a href="http://www.pcweek.ua" target="_blank"><img src="http://www.pcweek.ua/images/pcweek/logo-blog.gif" style="width:100px; height:30px; border:0;" alt="PC Week/UE"></a></td></tr><tr><td><a href="http://www.pcweek.ua/themes/detail.php?ID=157155" target="_blank"><img src="http://www.pcweek.ua/upload/iblock/a8a/Programmer.jpg" alt="Открыть материал" style="width:70px; height:50px; border:1px solid #000; float:left; margin:0 5px 5px 0;"></a><a href="http://www.pcweek.ua/themes/detail.php?ID=157155" target="_blank" style="font:14px Arial; color:#000; text-decoration:none; font-weight:bold;">Искусственный интеллект идентифицирует программиста по «почерку»</a><br><a href="http://www.pcweek.ua/themes/detail.php?ID=157155" target="_blank" style="font:12px Arial; color:#000; text-decoration:none;">Изучив работы 100 программистов, искусственный интеллект распознал 96% авторов, используя по восемь примеров кода от каждого разработчика. В случае с исходниками 600 участников конкурса точность...</a></td></tr><tr><td align="right"><a href="http://www.pcweek.ua/themes/detail.php?ID=157155" target="_blank" style="font:12px Arial;">Открыть материал</a></td></tr></table>

Комментарии к статье

Статьи по теме

Дослідження Rakuten Viber: 55% українців негативно реагують на дзвінки з незнайомих номерів

Респонденти також виокремили випадки, в яких повідомлення є більш зручними за дзвінок: питання від колег чи клієнтів (65% проти 35% за дзвінки), питання від магазинів, кур’єрів тощо (70% проти 30% за дзвінки), а також інші можливі розмови (78% проти 22% за дзвінки).

В R&D центрі YouControl проаналізували звітність парламентських партій, які отримали держфінансування

Фахівці YouControl проаналізували з Єдиного державного реєстру звітності політичних партій дані чотирьох політичних сил за 2022-2023 рр., що подолали 5% бар’єр у Верховній Раді: “Слуга Народу”, “Європейська Солідарність”, “Батьківщина”, “ГОЛОС...

Опитування: 44% ІТ-вців відзначили важливість волонтерства

Від початку повномасштабного вторгнення, лише завдяки внутрішньому телеграм каналу, фахівцям GlobalLogic вдалось зібрати понад 54 млн гривень на користь Збройних Сил. На питання «З чим асоціюється ваша дорожня карта на 2024 рік?»...

Дослідження Мінцифри: 93% українців володіють цифровими навичками

Під час дослідження українці визначили найпоширеніші заходи для безпечного користування інтернетом. Серед них — використання складних паролів, користування антивірусом, двофакторна автентифікація.

Опитування: як українці ставляться до дистанційної роботи

Результати опитування показали, що 24% українців віддають перевагу роботі вдома, адже це дозволяє їм краще зосередитись і налаштуватись на потрібний темп. З іншого боку, майже кожен пʼятий респондент постає...

Форум

Наступило время экспериментов (Noname, 08.04.2016 09:45:00)

Укртелеком в 4 раза снижает стоимость звонков на мобильные (СЕргей, 06.04.2016 19:11:59)

Укравтодор отмечает дорожные работы и перекрытия на Яндекс.Картах (Noname, 05.04.2016 17:30:44)

Яндекс.Карты объявляют конкурс для киевлян (Хтось, 17.02.2016 12:24:08)

Информационная безопасность: в поисках совершенной защиты (Лариса Ершова, 09.11.2015 18:39:47)

Другие темы

Газета PC Week Ukrainian Edition печатается по лицензионному соглашению с компанией Ziff Davis Publishing Inc. Перепечатка материалов допускается только c разрешения редакции. За содержание рекламных объявлений редакция ответственности не несет. Editorial items appearing in PC Week/UE that were originally published in the U.S. edition of PC Week are the copyright property of Ziff Davis Publishing Inc. Copyright 2015 Ziff Davis Inc. All rights reserved. PC Week is trademark of Ziff Davis Publishing Holding Inc.
© 2024 ООО “ПИСИВИК УКРАИНА”. Информация об авторских правах и порядке использования материалов сайта