Дослідники штучного інтелекту зі Стенфордського та Вашингтонського університетів змогли навчити модель «глибокого аналізу » ШІ менш ніж за 50 доларів за допомогою хмарних обчислень, повідомляється в науковій статті. Модель, відома під назвою s1, працює подібно до передових моделей міркувань, таких як o1 від OpenAI та R1 від DeepSeek, на тестах, що вимірюють математичні здібності та навички кодування. Модель s1 доступна на GitHub, разом з даними та кодом, які використовуються для її навчання.

Нагадаємо, що OpenAI o1 — це нова модель штучного інтелекту, розроблена для вирішення складних бізнес-завдань за допомогою глибокого аналізу та міркування. Вона здатна пояснювати користувачу ход своїх думок.

Команда розробників s1 розповіла, що вони почали з готової базової моделі, а потім допрацювали її за допомогою дистиляції − процесу вилучення «міркувальних» здібностей з іншої моделі ШІ шляхом навчання на її відповідях. Дослідники кажуть, що s1 створений на основі однієї з моделей глибокого аналізу Google, Gemini 2.0 Flash Thinking Experimental. Дистиляція − це той самий підхід, який дослідники з Берклі використали для створення моделі міркувань ШІ вартістю близько 450 доларів минулого місяця.