Google выпустила Nano Banana Pro для углубления генерации изображений в R&D и инженерные процессы

Google выпустила Nano Banana Pro для углубления генерации изображений в R&D и инженерные процессы


160
26 поделились, 160 баллы

Пример изображения, созданного Nano Banana Pro. Краткая подсказка: «Сгенерировать чистую техническую диаграмму в плоском инфографическом стиле, объясняющую основной поток непрерывного перемешиваемого реактора (CSTR) в химической инженерии. Добавить чёткие, читаемые подписи на английском для каждого компонента.»

Мой сосед, химический инженер, однажды отметил, что технологии ИИ выглядят впечатляюще, но пока не всегда практичны, когда модель изображения полностью испортила макет для небольшого строительного проекта.

Google представила Nano Banana Pro, также называемую Gemini 3 Pro Image, — обновлённую модель генерации и редактирования изображений на основе ядра Gemini 3 Pro. Модель интегрируется в более широкую мультимодальную систему, способную планировать сцены и учитывать текстовую и контекстную информацию, а не только формировать пиксели.

Запуск следует за широко распространённой популярностью предыдущей версии, известной как Nano Banana (Gemini 2.5 Flash Image), и отражает растущий интерес к научно-ориентированной генерации изображений. Такие системы всё чаще применяют не только для мемов, но и для технических схем, документации и интерфейсных макетов; получаемые изображения обычно рассматриваются как черновые, но разрыв с финальной продукцией сокращается.

Модель умеет объединять до 14 входных изображений — например, фотографии продукта, логотипы и эталонные материалы — в одном кадре разрешением 2K или 4K. При этом пользователю доступны тонкие настройки освещения, положения камеры, глубины резкости и цветокоррекции, что делает её полезной как для масштабной автоматической генерации рекламы, так и для технических визуализаций и концепт-рендеров.

Одной из существенных особенностей является «заякоривание» на актуальной информации: модель может запрашивать данные из поиска Google в реальном времени для создания более точных изображений — например, биологических схем, исторических карт или инфографики, отражающей текущие условия. Это расширяет возможности Gemini 3 Pro в части рассуждений и знания о мире, но теперь выражается напрямую в визуальном контенте.

Важное улучшение касается работы с текстом в изображениях: Nano Banana Pro оптимизирована для размещения разборчивых подписей и более длинных фрагментов текста непосредственно внутри картинки. Кроме того, реализована логика локализации, позволяющая переводить текст внутри изображения — например, меню или плакаты — сохраняя оригинальную компоновку и стиль.

Модель обеспечивает высокую точность управления внешним видом: можно поддерживать согласованный облик до пяти человек при комбинировании источников, а также выполнять локальные правки отдельных областей сцены без искажения остального изображения. Такая детализация полезна для дизайн‑обзоров, технической документации и визуализации экспериментальных установок.

Nano Banana Pro распространяется через приложение Gemini (в режиме изображений модели «Thinking»), Google AI Studio и платформу Antigravity, а также доступна в продукционных рабочих процессах через Vertex AI и Google Ads. Для инженерных и исследовательских команд это обещает ускорить создание визуализаций, которые выглядят ближе к отчётам или обзорным материалам, чем к просто «картинкам».


Понравилось? Поделитесь с друзьями!

160
26 поделились, 160 баллы

Какова ваша реакция?

Чего? Чего?
4
Чего?
Плачу Плачу
1
Плачу
Прикол Прикол
10
Прикол
Ого Ого
9
Ого
Злой Злой
8
Злой
Ржака Ржака
7
Ржака
Ух, ты! Ух, ты!
6
Ух, ты!
Ужас Ужас
4
Ужас
Супер Супер
1
Супер
Admin

Добро пожаловать на сайт Паутина AI. Здесь я публикую свежие новости, подробные обзоры и аналитику ведущих AI-сервисов. Оставайтесь c нами что бы быть в курсе событий в мире AI.

Комментариев

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Выберите формат
Пост
Форматированный текст с вставками и визуальными элементами
Опрос
Голосование для принятия решений или определения мнений
Изображение
Фото или GIF
Видео
Вставки с YouTube, Vimeo или Vine
Аудио
Вставки с SoundCloud или Mixcloud
Мем
Загружайте свои изображения для создания собственных мемов
Send this to a friend