3 месяца назад 3 месяца назад

Google выпустила Nano Banana Pro для углубления генерации изображений в R&D и инженерные процессы

Опубликовано: Admin 3 месяца назад3 месяца назад

173Просмотра

Пример изображения, созданного Nano Banana Pro. Краткая подсказка: «Сгенерировать чистую техническую диаграмму в плоском инфографическом стиле, объясняющую основной поток непрерывного перемешиваемого реактора (CSTR) в химической инженерии. Добавить чёткие, читаемые подписи на английском для каждого компонента.»

Мой сосед, химический инженер, однажды отметил, что технологии ИИ выглядят впечатляюще, но пока не всегда практичны, когда модель изображения полностью испортила макет для небольшого строительного проекта.

Google представила Nano Banana Pro, также называемую Gemini 3 Pro Image, — обновлённую модель генерации и редактирования изображений на основе ядра Gemini 3 Pro. Модель интегрируется в более широкую мультимодальную систему, способную планировать сцены и учитывать текстовую и контекстную информацию, а не только формировать пиксели.

Запуск следует за широко распространённой популярностью предыдущей версии, известной как Nano Banana (Gemini 2.5 Flash Image), и отражает растущий интерес к научно-ориентированной генерации изображений. Такие системы всё чаще применяют не только для мемов, но и для технических схем, документации и интерфейсных макетов; получаемые изображения обычно рассматриваются как черновые, но разрыв с финальной продукцией сокращается.

Модель умеет объединять до 14 входных изображений — например, фотографии продукта, логотипы и эталонные материалы — в одном кадре разрешением 2K или 4K. При этом пользователю доступны тонкие настройки освещения, положения камеры, глубины резкости и цветокоррекции, что делает её полезной как для масштабной автоматической генерации рекламы, так и для технических визуализаций и концепт-рендеров.

Одной из существенных особенностей является «заякоривание» на актуальной информации: модель может запрашивать данные из поиска Google в реальном времени для создания более точных изображений — например, биологических схем, исторических карт или инфографики, отражающей текущие условия. Это расширяет возможности Gemini 3 Pro в части рассуждений и знания о мире, но теперь выражается напрямую в визуальном контенте.

Важное улучшение касается работы с текстом в изображениях: Nano Banana Pro оптимизирована для размещения разборчивых подписей и более длинных фрагментов текста непосредственно внутри картинки. Кроме того, реализована логика локализации, позволяющая переводить текст внутри изображения — например, меню или плакаты — сохраняя оригинальную компоновку и стиль.

Модель обеспечивает высокую точность управления внешним видом: можно поддерживать согласованный облик до пяти человек при комбинировании источников, а также выполнять локальные правки отдельных областей сцены без искажения остального изображения. Такая детализация полезна для дизайн‑обзоров, технической документации и визуализации экспериментальных установок.

Nano Banana Pro распространяется через приложение Gemini (в режиме изображений модели «Thinking»), Google AI Studio и платформу Antigravity, а также доступна в продукционных рабочих процессах через Vertex AI и Google Ads. Для инженерных и исследовательских команд это обещает ускорить создание визуализаций, которые выглядят ближе к отчётам или обзорным материалам, чем к просто «картинкам».

Какова ваша реакция?

Чего?

Плачу

Прикол

Ого

Злой

Ржака

Ух, ты!

Ужас

Супер

Автор: Admin

Добро пожаловать на сайт Паутина AI. Здесь я публикую свежие новости, подробные обзоры и аналитику ведущих AI-сервисов. Оставайтесь c нами что бы быть в курсе событий в мире AI.