Компанія Google нарешті дозволила своїм користувачам створювати зображення людей за допомогою чат-бота Gemini AI. У своєму анонсі Google повідомляє, що «найближчими днями» випустить версію раннього доступу до цієї функції для користувачів Gemini Advanced, Business і Enterprise англійською мовою.
Нагадаємо, що у лютому 2024 року Google призупинила можливість створювати зображення людей в Gemini після того, як користувачі виявили, що цей чат-бот створює історично неточні зображення, наприклад, расово різноманітних нацистів.
Нова функція буде заснована на Imagen 3, новітній версії генератора текстових зображень зі штучним інтелектом від Google. Компанія запустила Imagen 3 на своїй тестовій кухні ШІ на початку цього місяця, а тепер ця розробка з'явиться в Gemini всіма мовами. Оновлений інструмент здатний створювати що завгодно – від фотореалістичних пейзажів до текстурованих олійних картин з описом «лише з кількох слів».
Оновлена модель Imagen 3 має вбудовані засоби захисту і «працює краще, ніж інші доступні моделі генерації зображень», про це говорить Дейв Цитрон, старший директор Google з управління продуктами Gemini. До речі, Gemini не слід плутати з новою функцією Google Remagine, яка дозволяє включати елементи штучного інтелекту у фотографії, зняті на нову лінійку телефонів Pixel 9.
Крім того, Gemini не дозволить користувачам створювати фотореалістичні зображення публічних осіб, контент за участю неповнолітніх, а також криваві, насильницькі та сексуальні сцени. «Звичайно, не кожне зображення, створене Gemini, буде ідеальним, але ми будемо продовжувати прислухатися до відгуків користувачів раннього доступу до Gemini Advanced, оскільки ми продовжуємо вдосконалюватися», - додає Цитрон. Незабаром Google планує розширити можливість створювати людей, згенерованих штучним інтелектом, на більшу кількість користувачів і мов.