Програмне забезпечення

	Версия для печати
	Версия для печати с изображениями
	Отправить ссылку
	Поместить в блог
	Добавить комментарий
	Написать в редакцию
	Подписаться на рассылки

В IEEE дослідили, наскільки добре ChatGPT генерує програмний код

08.07.2024

В Інституті інженерів з електротехніки та електроніки (Institute of Electrical and Electronics Engineers, IEEE) вирішили перевірити, як генератор коду на базі ШІ вміє програмувати у порівнянні з людиною-програмістом.

Дослідження, опубліковане в червневому випуску IEEE Transactions on Software Engineering, оцінювало код, створений ChatGPT від OpenAI, з точки зору функціональності, складності та безпеки. Результати показали, що ChatGPT демонструє доволі непогані результати, коли справа доходить до створення функціонального коду − з показником успішності від 0,66% до 89%, залежно від складності завдання, мови програмування та низки інших факторів. І хоча в деяких випадках ШІ-генератор може створювати кращий код, ніж людина, аналіз також виявив деякі проблеми з безпекою коду, створеного за допомогою штучного інтелекту.

У дослідженні було протестовано можливості ChatGPT-3.5 на 728 задачах кодування з тестової платформи LeetCode на п'яти мовах програмування: C, C++, Java, JavaScript та Python.

Виявилося, що загалом, ChatGPT досить добре вирішував проблеми на різних мовах програмування − але в основному, коли мова йшла про завдання по кодуванню, які були опубліковані на LeetCode до 2021 року. Наприклад, він зміг створити функціональний код для легких, середніх і складних завдань з показниками успішності близько 89, 71 і 40 відсотків відповідно.

Однак, коли справа доходить до завдань про програмуванню після 2021 року, здатність ChatGPT генерувати функціонально правильний код страждає. Іноді ШІ не розуміє сенсу запитань, навіть коли мова йде про завдання легкого рівня. Наприклад, здатність ChatGPT створювати функціональний код для «легких» завдань знизилася з 89% до 52% після 2021 року. Водночас здатність генерувати функціональний код для «складних» завдань впала з 40% до 0,66%. Але цікаво, що ChatGPT здатен генерувати код з меншими витратами часу на виконання та споживанням ресурсів пам'яті, ніж принаймні 50 відсотків людських рішень для тих самих завдань LeetCode.

Дослідники також вивчили здатність ChatGPT виправляти власні помилки кодування після отримання зворотного зв'язку від LeetCode. Вони випадковим чином вибрали 50 сценаріїв кодування, в яких ChatGPT спочатку згенерував неправильне кодування, або через те, що не зрозумів змісту або проблеми, що виникла. Хоча ChatGPT добре виправляв помилки компіляції, він, як правило, не дуже добре виправляв свої власні помилки... Дослідники також виявили, що код, згенерований ChatGPT, мав досить багато вразливостей, таких як відсутність нульового тесту, але багато з них можна було легко виправити.

Поместить в блог

<table border="0" width="75%" style="margin:10px; border:2px solid #036; background-color:#FFF;"><tr><td align="right"><a href="http://www.pcweek.ua" target="_blank"><img src="http://www.pcweek.ua/images/pcweek/logo-blog.gif" style="width:100px; height:30px; border:0;" alt="PC Week/UE"></a></td></tr><tr><td><a href="http://www.pcweek.ua/themes/detail.php?ID=169271" target="_blank"><img src="http://www.pcweek.ua/upload/iblock/384/Programmer.jpg" alt="Открыть материал" style="width:70px; height:50px; border:1px solid #000; float:left; margin:0 5px 5px 0;"></a><a href="http://www.pcweek.ua/themes/detail.php?ID=169271" target="_blank" style="font:14px Arial; color:#000; text-decoration:none; font-weight:bold;">В IEEE дослідили, наскільки добре ChatGPT генерує програмний код</a><br><a href="http://www.pcweek.ua/themes/detail.php?ID=169271" target="_blank" style="font:12px Arial; color:#000; text-decoration:none;">У дослідженні було протестовано  можливості ChatGPT-3.5 на 728 задачах кодування з тестової платформи LeetCode на п'яти мовах програмування: C, C++, Java, JavaScript та Python.</a></td></tr><tr><td align="right"><a href="http://www.pcweek.ua/themes/detail.php?ID=169271" target="_blank" style="font:12px Arial;">Открыть материал</a></td></tr></table>

Комментарии к статье

Статьи по теме

Rakuten Viber запустив чатбот ШІ Санту

Напередодні Різдва Rakuten Viber запустив чатбот, створений на базі штучного інтелекту — ШІ Санту. ШІ помічник допоможе українцям отримати відповіді на святкові питання: що приготувати, які подарунки обрати чи як прикрасити дім.

Airbus намагається перейти з продуктів Microsoft на хмарні сервіси Google, але поки що безуспішно

На сьогоднішній день більше двох третин із 150 тисяч співробітників Airbus повністю перейшли на нову систему, але значна частина продовжує паралельно використовувати Microsoft. Наприклад, фінансовий відділ все ще покладається...

Suse випустила першу корпоративну ОС Linux з інтегрованим агентом штучного інтелекту

Для підприємств цей запуск є чітким кроком до вбудовування інтелекту на рівні інфраструктури. Тепер система може виконувати адміністрування за допомогою штучного інтелекту через Cockpit або командний рядок...

OPPO анонсувала глобальний випуск ColorOS 16

Після успішного впровадження технології Parallel Animation (Паралельна анімація) у ColorOS 15, нова версія представляє Seamless Animation — рішення, що забезпечує миттєву, безперервну реакцію системи на кожну дію користувача.

Microsoft припинила підтримку Windows 10

Але ця дата закінчення підтримки також не є остаточною. Домашні користувачі з ПК під управлінням Windows 10 можуть зареєструватися в програмі Microsoft Extended Security Updates (ESU), яка продовжує термін підтримки ще на один рік...

Форум

Наступило время экспериментов (Noname, 08.04.2016 09:45:00)

Укртелеком в 4 раза снижает стоимость звонков на мобильные (СЕргей, 06.04.2016 19:11:59)

Укравтодор отмечает дорожные работы и перекрытия на Яндекс.Картах (Noname, 05.04.2016 17:30:44)

Яндекс.Карты объявляют конкурс для киевлян (Хтось, 17.02.2016 12:24:08)

Информационная безопасность: в поисках совершенной защиты (Лариса Ершова, 09.11.2015 18:39:47)

Другие темы

Газета PC Week Ukrainian Edition печатается по лицензионному соглашению с компанией Ziff Davis Publishing Inc. Перепечатка материалов допускается только c разрешения редакции. За содержание рекламных объявлений редакция ответственности не несет. Editorial items appearing in PC Week/UE that were originally published in the U.S. edition of PC Week are the copyright property of Ziff Davis Publishing Inc. Copyright 2015 Ziff Davis Inc. All rights reserved. PC Week is trademark of Ziff Davis Publishing Holding Inc.
© 2026 ООО “ПИСИВИК УКРАИНА”. Информация об авторских правах и порядке использования материалов сайта