
Google представила в приложении Gemini инструмент редактирования изображений Nano Banana 26 августа. В первые дни после запуска функция набрала более 10 миллионов загрузок и обеспечила свыше 200 миллионов редактирований изображений, по данным компании.
С 6 сентября инструмент также стал доступен в X (ранее Twitter), где пользователи могут генерировать изображения, отмечая Nano Banana в публикациях и добавляя текстовые подсказки. Это расширило возможности создания изображений за пределами основного приложения.
Nano Banana — модель для генерации и редактирования изображений, встроенная в приложение Gemini. Она позволяет преобразовывать фотографии с помощью инструкций на естественном языке и доступна через приложение Gemini, API Gemini, Google AI Studio и Vertex AI.
Запуск опирается на набор моделей Gemini 2.0 Flash, представленный в феврале, который учитывал отзывы пользователей для повышения качества изображений и управления творческим процессом. Модель Gemini 2.5 Flash Image предлагается по цене 30 долларов за миллион выходных токенов; средняя стоимость одного изображения составляет примерно 0,039 доллара.
Инструмент выполняет редактирование объектов на фото, сохраняет согласованность персонажей в разных сценах, объединяет несколько изображений и вносит изменения по текстовым подсказкам. Примеры таких изменений включают удаление людей из кадра, размытие фона и коррекцию освещения.
Бренды быстро стали использовать Nano Banana в рекламных кампаниях и промо‑материалах. Google продвигала сотрудничества, в том числе с Coca‑Cola India с участием Сонэм Баджва, Шубманом Гиллом и Джанви Капур, а также с совладельцем Boat Аманом Гуптой; инструмент применяли для создания музыкальных промо и контента в социальных сетях.
В образовательной сфере модель может распознавать нарисованные от руки схемы, помогать с практическими вопросами и давать интерактивные объяснения, что позиционирует её как средство для творческого и наглядного обучения.
На фоне конкурентов Nano Banana выделяется возможностями продвинутого редактирования фото, манипуляции 3D‑объектами и объединения нескольких изображений, тогда как другие сервисы делают упор на генерацию видео, например Sora от OpenAI, Adobe Firefly Video и функции на базе Veo 3 у других платформ.


Комментариев