
Midjourney долгое время считался эталоном среди генераторов изображений за креативность, реализм и универсальность. Но модель Nano Banana от Google быстро набирает популярность: она лёгкая, быстрая и хорошо подходит для создания вирусных картинок; в приложении Gemini насчитывается около 23 миллионов пользователей. Для сравнения обе модели прогоняли через одинаковые девять подсказок, проверяющие реализм, стиль, юмор, рендеринг текста и повествование.
Фотографизм. Подсказка — гиперреалистичный портрет пожилой женщины при мягком золотом закатном свете. Nano Banana сгенерировала одно изображение, которое полностью соответствовало всем элементам подсказки, включая требуемое освещение. Midjourney выдал больше вариантов, но ни один не передал эффект заката так точно.
Фэнтезийный миростроение. Подсказка — парящий над водопадом замок из стекла и кристаллов с летающими драконами и наблюдающими жителями. Nano Banana создала впечатляющую сцену, но излишне ровные облака и равномерное расположение птиц придавали изображению искусственность. Midjourney предложил четыре картинки, которые не только воспроизводили заданные элементы, но и добавляли детали, усиливающие ощущение волшебства.
Тест повседневного реализма. Подсказка — оживлённое нью-йоркское кафе в дождливый день с отражениями на полу и людьми за ноутбуками. Nano Banana подчеркнула дождливую атмосферу, но поставила зонты высоко и одинаково, что выглядело неправдоподобно; персонажи были мало разнообразны. Midjourney добавил больше разнообразия среди посетителей и передал ощущение занятости, хотя дождь снаружи виден слабее.
Юмор и сюрреализм. Подсказка — корги в образе самурая на скейтборде в бамбуковом лесу в стиле укийо-э. Nano Banana лучше передала эстетику древесной печати и самурайский образ собаки. Midjourney предложил милые варианты поз и образов, но проблемы с читабельностью надписей в некоторых изображениях снизили их качество.
Задача по отображению текста. Подсказка — неоновая вывеска «OPEN 24 HOURS» ночью с отражениями на мокром асфальте и ретро-кафе на заднем плане. Nano Banana корректно отобразила надпись и показала фотореалистичный фасад, но отражение в луже выглядело несколько постановочно. Midjourney создал более правдоподобные сцены в целом, хотя в одном из вариантов слово «hours» было написано с ошибкой.
Кинематографический пейзаж. Подсказка — широкоугольный кадр чёрных песчаных пляжей Исландии с мощными волнами, штормовым небом и человеком в красном дождевике. Nano Banana выдала сбалансированное, правдоподобное изображение с чувством глубины и драматизма. Midjourney тоже дал эффектные кадры, но волны получились настолько гигантскими, что композиции выглядели ближе к фэнтези, чем к реальности.
Абстрактный/стилистический подход. Подсказка — кубистская картина джаз-бэнда в дымном клубе в духе Пикассо, с преувеличенными формами и смелыми цветами. Nano Banana создала оригинальное изображение, которое выглядело как настоящая художественная работа. Midjourney отдал четыре варианта, но они были схожи между собой и не выделялись разнообразием.
Милые и вирусные изображения. Подсказка — детёныш слона в надувном бассейне с резиновыми уточками, в больших солнечных очках, пастельный мультяшный стиль. Nano Banana точно соответствовала рисунку и передала игривую, книжную эстетику. Midjourney сместился в сторону более реалистичной подачи: результаты симпатичны, но не соответствуют запросу на мультяшный рисунок.
Итоговое сравнение. По сумме тестов Nano Banana часто превосходила ожидания, особенно в фотореализме, юморе и стилистических задачах, демонстрируя быстрые и верные подсказкам результаты. Midjourney сохранил свои сильные стороны в создании сложных миров и повседневных сцен, предлагая больше вариантов и слоистых деталей. В этом соперничестве Nano Banana получила преимущество, но разрыв невелик: это скорее разделённое решение, а не явный нокаут, и дальнейшие тесты будут полезны по мере развития инструментов искусственного интеллекта.


Комментариев