Видання New Atlas повідомляє про дослідницьку групу, яка вельми успішно використала технологію GPT-4 для виявлення 87% нещодавно знайдених вразливостей безпеки, для яких ще не було випущено виправлення. Цього тижня ця ж команда отримала ще кращі результати за рахунок застосування групи автономних, саморозповсюджуваних агентів Великої Мовної Моделі (Large Language Model), які використовували метод ієрархічного планування з агентами для конкретних завдань (HPTSA). Фактично замість того, щоб призначати одного агента LLM, який намагається вирішити багато складних завдань, HPTSA використовує «агента планування», який контролює весь процес і запускає кілька «субагентів», які відповідають за конкретні завдання. При порівнянні з 15 реальними веб-орієнтованими вразливостями, HPTSA виявився на 550% ефективнішим у використанні вразливостей, ніж одиночний LLM, і зміг хакнути 8 з 15 вразливостей нульового дня. Одиночний агент LLM зміг зламати лише 3 з 15 вразливостей.

«Наші висновки свідчать про те, що кібербезпека, як з наступального, так і з оборонного боку, буде розвиватися у все більш високих темпах, − підсумовують дослідники. − Зараз зловмисники можуть використовувати ШІ-агентів для злому веб-сайтів. З іншого боку, дослідники, що проводять пен-тести (penetration tester) можуть використовувати ШІ-агентів для більш частого теста на проникнення. Наразі незрозуміло, чи будуть агенти ШІ більше сприяти нападам чи захисту кібербезпеки, і ми сподіваємося, що майбутні дослідження дадуть відповідь на це питання.

«Окрім безпосереднього впливу нашої роботи, ми сподіваємося, що вона надихне провайдерів прикордонних LLM-програм ретельно продумати своє розгортання».