Компанія OpenAI оголосила про випуск двох мовних моделей з відкритою вагою, що стало першим таким релізом цього стартапу з часів GPT-2 у 2019 році. Моделі gpt-oss-120b і gpt-oss-20b можуть працювати локально на споживчих пристроях і бути налаштовані для конкретних цілей. Обидві моделі використовують підходи міркування ланцюжком думок, вперше застосовані в моделі o1 OpenAI, і можуть переглядати вебсторінки, виконувати код і функціонувати як агенти штучного інтелекту.

Нагадаємо, що моделі Open-Weight (відкриті ваги) — це тип моделей штучного інтелекту, які надають доступ до попередньо навчених параметрів без надання вихідного коду або даних, на яких вони були навчені. Це дозволяє користувачам адаптувати вже існуючі моделі для своїх потреб, не маючи доступу до всього процесу навчання.

Менша модель з 20 мільярдами параметрів працює на споживчих пристроях з 16 ГБ пам'яті. Модель gpt-oss-120B потребує близько 80 ГБ пам'яті. OpenAI заявила, що модель з 120 мільярдами параметрів працює аналогічно до власних моделей компанії o3 та o4-mini. Обидва продукти доступні безкоштовно на Hugging Face під ліцензією Apache 2.0 і пройшли тестування безпеки, яке затримало їх анонс в березні.