Нова модель «nano banana» від Google DeepMind (офіційна назва Gemini 2.5 Flash Image) посіла перше місце в рейтингу лідерів у галузі редагування зображень за допомогою штучного інтелекту, забезпечуючи набагато більш послідовне редагування, ніж раніше. Сьогодні вона впроваджується в додаток Gemini. Тепер редагування зображень за допомогою штучного інтелекту дозволяє модифікувати їх за допомогою команд, а не возитися з Photoshop.
Google вперше надав можливості редагування в Gemini на початку цього року, і модель виявилася цілком просунутою з самого початку. Але, як і у всіх генеративних системах, елементи зображення часто змінювалися непередбачуваним чином. Google стверджує, що nano banana має неперевершену послідовність редагування — вона може запам'ятовувати деталі, а не «імітувати гру в лотерею» щоразу, коли ви вносите зміни.
Це відкриває кілька цікавих можливостей для редагування зображень за допомогою штучного інтелекту. Google пропонує завантажити фотографію людини і змінити її стиль або одяг. Наприклад, ви можете перетворити когось на супермена чи персонажа з минулого століття . Оскільки модель nano banana здатна підтримувати цілісність під час редагування, результати все одно повинні виглядати як людина на оригінальному зображенні. Це також стосується випадків, коли ви робите кілька редагувань поспіль. Google стверджує, що навіть у цьому випадку результати повинні виглядати як оригінальний матеріал.
Розширені можливості редагування зображень Gemini також дозволяють об'єднувати кілька зображень, що дає змогу використовувати їх як матеріал для створення нового зображення на ваш вибір. Для прикладу, Google бере окремі зображення жінки та собаки і використовує їх для створення нового знімка, на якому жінка пестить собаку. Редагування зображень Gemini також може об'єднувати об'єкти більш абстрактним чином і буде слідувати вашим вказівкам, щоб створити практично все, що не суперечить обмеженням моделі.