Вчора на своєму заході DevDay компанія OpenAI повідомила про надання стороннім розробникам доступу до свого engine speech-to-speech, який забезпечує роботу розширеного голосового режиму ChatGPT. Зазначається, що цей крок відкриває шлях для серії застосунків зі штучним інтелектом, які пропонують розмовні голосові інтерфейси.
Серед перших тестувальників цієї функції – застосунок для харчування та фітнесу Healthify та додаток для вивчення мов Speak. Інші нові функції, доступні розробникам, включають можливість точного налаштування моделей на основі зображень. На демонстрації для журналістів керівники OpenAI показали приклад нових аудіо-можливостей у поєднанні з API Twilio, що дозволило ШІ-помічнику зателефонувати до вигаданої кондитерської та зробити замовлення на 400 полуниць у шоколаді.
Розробники зможуть використовувати лише голоси, надані OpenAI, притому ті самі, що є опціями в ChatGPT. Хоча голос не буде жодним чином позначений «водяними знаками», і розробникам не доведеться змушувати ШІ-систему ідентифікувати себе, OpenAI заявляє, що використання її систем для спаму або введення людей в оману суперечить умовам надання послуг компанії.