
Соревнование среди генераторов изображений на базе ИИ усилилось, и особое внимание привлёк вирусный тренд превращения обычных фотографий в трёхмерные фигурки. Модель Google, известная как Nano Banana (Gemini 2.5 Flash), стала широко распространённой в лентах соцсетей благодаря быстрой генерации подробных и натуралистичных изображений. Конкуренты — ChatGPT (GPT-5), Qwen Image Edit и Grok — предлагают свои преимущества, поэтому мы прогнали все четыре системы по одному сложному запросу, чтобы сравнить реализм, детализацию, скорость и точность исполнения.
Nano Banana часто называют лидером тренда 3D‑фигурок: её результаты быстро становятся вирусными в Instagram, TikTok и X. Модель сбалансирована по скорости и фотореализму, естественно прорабатывает текстуры, освещение и дизайн упаковки, что делает изображения готовыми к публикации без дополнительной обработки. Google также внедрил технологию невидимой водяной маркировки SynthID для повышения доверия к созданному контенту, однако модель иногда испытывает трудности с тонкими чертами лица.
Тестовый запрос требовал создать коммерческую фигурку в масштабе 1/7 в реалистичном стиле, помещённую в реальную обстановку на компьютерном столе. Фигурка должна была стоять на круглой прозрачной акриловой подставке без надписей, а на экране компьютера должен был отображаться процесс 3D‑моделирования этой фигурки. Рядом с экраном предусматривалась коробка упаковки в стиле коллекционных фигурок с оригинальным художественным оформлением и плоскими двухмерными иллюстрациями.
Qwen Image Edit, разработанный Alibaba, зарекомендовал себя как система, ориентированная на детализацию. В нём особенно хорошо передаются текстуры, складки ткани, тени и объекты заднего плана, что даёт картинкам высокую чёткость и ощущение глубины. Qwen умеет интерпретировать смысл запросов, а не только следовать им дословно, поэтому среды получаются естественными и правдоподобными. Вместе с тем передача лиц у этой модели бывает непоследовательной и иногда лишённой эмоциональной выразительности.
ChatGPT (модель GPT‑5) выделяется точностью исполнения инструкций и способностью корректно обрабатывать сложные многоуровневые подсказки. При выполнении задания GPT‑5 точно воспроизводил такие детали, как прозрачная подставка, расположение на столе и оформление упаковки. Главные ограничения этой системы — скорость генерации и ограничения по бесплатному использованию, которые затрудняют быструю итерацию для массовых пользователей. Как и у некоторых других моделей, у GPT‑5 наблюдаются огрехи в проработке глаз и рта, что снижает фотореалистичность лиц.
Grok AI, связанный с проектами Илона Маска, когда‑то был популярен для бесплатного создания изображений, но в тестах показал более низкую степень реалистичности 3D‑моделей по сравнению с Nano Banana, Qwen и GPT‑5. Его сильная сторона — генерация видео: Grok умеет оживлять статичные фигурки, создавая короткие ролики со звуковыми эффектами. Это делает его полезным инструментом для авторов, которым важна динамика и повествовательность, а не только точность статичной модели.
Google Gemini позиционируется как мультимодальная платформа, объединяющая понимание языка с обработкой изображений, аудио и кода и выступающая преемником семейства моделей PaLM. Один из популярных вариантов — Gemini 2.5 Flash, часто называемый Nano Banana, — привлёк внимание благодаря сочетанию скорости, фотореализма и механизмов доверия, таких как SynthID. Gemini стремится быть как инструментом для широкой аудитории, так и платформой для профессионального использования за счёт интеграции с инфраструктурой Google.
Сравнение показывает, что абсолютного победителя нет: каждая модель заняла свою нишу. Nano Banana лидирует по скорости и фотореалистичности, что делает её удобной для социальных создателей контента. Qwen выделяется в передаче деталей и создании правдоподобных окружений, GPT‑5 лучше всего справляется с пониманием сложных инструкций, а Grok ценен возможностями анимации. Gemini выступает как объединяющая экосистема, сочетающая творческие функции Nano Banana с возможностями для профессиональных сценариев.


Комментариев