Если вы хоть раз пытались сгенерировать картинку в нейросети, вы знаете этот фокус. Пишешь: "Красивый закат на море, девушка с зонтиком, реализм". Получаешь: девушку с шестью пальцами, зонтик, парящий в воздухе, и закат ядерного взрыва. Знакомо?
Последние полгода на рынке генеративных моделей творится что-то невероятное. Сначала Google DeepMind тихо, без лишнего шума, выпустила Nano Banana Pro (она же Gemini 3 Pro Image Preview). А через пару месяцев OpenAI выкатила GPT Image 1.5, пообещав ускорение в 4 раза и прорывное качество.
И началось. В одних обзорах Nano Banana Pro называют королём фотореализма и скорости. В других - ругают за полное непонимание русского языка. Про GPT Image 1.5 пишут, что он наконец-то научился редактировать изображения, но тут же жалуются, что он тормозит и режет текст на полуслове.
Кто врёт? Да никто. Просто модели реально разные. И задачи у них разные.
Я решила не гадать на кофейной гуще, а устроить этим двум художникам полноценный конкурс. Взяла 8 промптов разной степени извращённости, прогнала каждую модель по 3-5 раз, замерила скорость, проверила анатомию, русский язык, редактирование и способность помнить персонажа от кадра к кадру.
Выбрать лучшую не получится. Придётся выбирать под свою задачу. Но после этой статьи вы будете знать точно, какая модель для чего нужна.
Поехали, приятного прочтения!
Чтобы тест был честным, я сделала следующее:
Платформа. Тестирование Nano Banana Pro проводилось через платформу BotHub. Агрегатор собрал все популярные модели нейросетей в одном месте. Удобно, когда всё в одном окне и не надо прыгать по десятку вкладок с разными аккаунтами. А по ссылке вы можете получить 300 000 капсов для первых задач. Доступ к GPT Image 1.5 - через платную подписку ChatGPT Pro.
Настройки. Размер изображений максимальный доступный (для NBP - до 4K, но для чистоты эксперимента выставляла 1536x1536, чтобы сравнять шансы с GPT). Степень следования промпту - стандартная (7.5 там, где можно было регулировать). Стили без применения, только прямая инструкция.
Промпты. Составила список из 8 заданий, которые покрывают основные сценарии использования: простые объекты, портреты (проверка анатомии), сложные сцены с несколькими объектами, стилизации под художников, текст на русском (вывески, рукописный), инфографика и диаграммы, многошаговое редактирование, удержание персонажа в серии изображений.
Замеры. Время засекала от нажатия кнопки генерации до полной загрузки изображения. Для каждого промпта минимум 3 замера, брала среднее.
Оценка. По 10-балльной шкале по каждому критерию. Оценки субъективные, но с опорой на чёткие критерии (количество пальцев, читаемость букв, соответствие описанию).
Я прогнала каждый промпт минимум трижды и замерила время. Результаты получились, честно говоря, неожиданными.
Nano Banana Pro оказался настоящим спринтером. Среднее время генерации - 7.2 секунды. Это с учётом того, что модель честно рисовала сложные сцены с енотами и фермерами. Максимум, что я увидела - 8.4 секунды на самой замороченной картинке. Минимум - 6.1 секунды на простом яблоке.
GPT Image 1.5 работает ровно в два раза медленнее. Среднее время - 14.8 секунды. OpenAI обещали ускорение, но, видимо, по сравнению с версией 1.0, которая выдавала картинку под минуту. Здесь же почти 15 секунд, и это ощущается.
Таблица скорости:
|
Промпт |
Nano Banana Pro |
GPT Image 1.5 |
|---|---|---|
|
Яблоко (простой объект) |
6.1 |
12.3 |
|
Фермер (портрет, анатомия) |
7.0 |
14.5 |
|
Tesla в деревне (сложная сцена) |
7.8 |
15.9 |
|
Ван Гог (стилизация) |
7.2 |
14.1 |
|
Тетрадь с текстом (русский, длинный) |
8.4 |
16.2 |
|
Диаграмма (инфографика) |
7.5 |
15.0 |
|
Кофейня (многошаговое редактирование) |
8.1 |
16.5 |
|
Кот в трёх кадрах (удержание персонажа) |
7.9 |
15.8 |
|
Среднее |
7.5 |
15.0 |
Что это значит на практике? Если вам нужно сгенерировать 100 картинок для сайта или соцсетей, Nano Banana Pro сделает это примерно за 12 минут. GPT Image 1.5 будет пыхтеть почти 25 минут. Разница существенная.
Но скорость не главное. Если картинка на выходе - пальцы веером и текст абракадаброй, то быстрый результат не нужен. Поэтому лезем в качество.
Это задание как проверка зрения у окулиста. С него начинают, чтобы понять, справляется ли модель с базой: форма, цвет, освещение, фактура.
Nano Banana Pro выдал яблоко, которое хочется съесть. Форма идеальная, с лёгкой асимметрией, как у настоящего фрукта. Цвет - равномерно красный с жёлтыми подпалинами у хвостика, очень натурально. Фактура кожицы проработана - видны микро-точки, лёгкий восковый налёт. Студийный свет даёт правильные блики: один яркий блик на боку, мягкое отражение от поверхности. Хвостик зелёный, с фактурой древесины. Всё честно.
GPT Image 1.5 тоже нарисовал яблоко. Тоже красное, тоже на белом фоне. Но есть ощущение, что это не фотография, а качественная 3D-визуализация. Кожица слишком гладкая, без микро-фактуры. Блик правильный, но свет какой-то стерильный. Яблоко выглядит аккуратным, но неживым. Как муляж в дорогом магазине.
Обе модели базовый тест проходят. Но Nano Banana Pro делает это с отрывом за счёт фактуры и естественности. GPT Image 1.5 рисует правильно, но пластиково.
GPT Image 1.5 выдал изображение, которое я без колебаний подписала бы как кадр из документального фильма.
Морщины проработаны с фотографической точностью - это не просто текстура, наложенная на лицо, а естественные складки кожи, заломы у глаз, глубокие носогубные складки. Руки - отдельный разговор, ровно пять пальцев, с правильными пропорциями фаланг. Утренний свет передан корректно: тени длинные, свет тёплый, контраст мягкий.
Nano Banana Pro тоже справился отлично. Пальцы на месте - пять, без сюрпризов. Морщины прорисованы, улыбка добрая, свет утренний.
Но есть нюанс, который заметен при сравнении рядом: кожа выглядит чуть более прилизанной, словно через портрет пропустили легкий бьюти-фильтр. Морщины есть, но они кажутся более симметричными, менее хаотичными, чем в реальной жизни.
Тем не менее, если показать этот портрет без сравнения с конкурентом, вопросов не возникнет - это качественная реалистичная генерация.
Обе модели прошли тест на анатомию без провалов. Пальцы на месте, пропорции соблюдены, свет передан корректно.
Nano Banana Pro GPT Image 1.5 выигрывает за счёт микро-деталей: текстура кожи выглядит более естественной и разнообразной, морщины не повторяются от генерации к генерации, создаётся ощущение, что у этого фермера есть реальная биография.
Nano Banana Pro даёт чуть более причёсанный результат - хороший реализм, но с лёгким налётом студийной обработки. Для 90% задач этого хватит за глаза, но хардкорные охотники за фотореализмом, скорее всего, выберут первого.
Этот промпт специально для того, чтобы проверить, как модели справляются с культурным контекстом и логикой.
GPT Image 1.5 подошёл к задаче формально. Тесла есть, грязь есть, деревня угадывается (дома деревянные на фоне). Мужики в телогрейках стоят, снимают, все как положено. Но машина слишком маленькая относительно мужиков. Это сильно бросилось мне в глаза. Пропорции не соблюдены, косяк. А мужики просто стоят, скучно, без динамики, все как на подбор одинаковые.
Результат Nano Banana Pro понравился мне больше. Тесла стоит в грязи, да, не по колено, но видны борозды от колес. Вокруг четверо мужиков. У всех телогрейки, в руках телефоны. Один показывает пальцем. У каждого лицо с выражением "ну, доллары, блин, поехали". Картинка буквально кричит: "Россия - родина сюрпризов", я увидела динамику, увидела смех на лицах. А главное - пропорции соблюдены. Машина и люди выглядят гармонично.
Вердикт - Nano Banana Pro понимает контекст и умеет добавлять детали, которых нет в промпте, но которые делают картинку живой. GPT рисует ровно то, что попросили, и ни буквой больше, а еще не соблюдает габариты.
Тут мы проверим, как модели способны воспроизвести стиль определённого художника, а не просто создать красивое изображение.
GPT Image 1.5 сделал ставку на игру света. Цвета темнее, чем у Ван Гога. Мазки есть, но они какие-то аккуратные, словно их компьютером рисовали, а не кистью наносили. Девушка при этом чуть искажена - черты лица слегка поплыли.
В целом фото получилось скучным, от Ван Гога мало что присутствует, лишь общий вид отдаленно напоминает. Конкурент точнее.
Nano Banana Pro явно знает, кто такой Ван Гог. Мазки узнаваемые - густые, раздельные, энергичные. Цвета яркие, но в рамках ван-гоговской палитры: синее, жёлтое, зелёное. Девушка при этом сохраняет портретные черты, не превращается в абстракцию.
Видно, что модель понимает разницу между портретом и стилизацией - лицо проработано достаточно, чтобы мы узнали человека, но мазки лежат поверх, создавая нужный эффект.
Nano Banana Pro с первой попытки выдал правильный текст. "Кофе с собой" - кириллица, буквы ровные, читаемые. Шрифт действительно красивый, с засечками, закорючками. Табличка деревянная, фактура передана хорошо. Никаких "с сабой" или латинских вкраплений, которые я ожидала увидеть. Модель явно подтянула русский язык с момента последних обзоров.
GPT Image 1.5 тоже написал правильно. "Кофе с собой" - всё чётко, без ошибок. Шрифт чуть проще, чем у конкурента, но тоже симпатичный. Табличка деревянная, висит на кованых петлях. Немного простоватенько выглядит, но в целом модель с задачей справилась.
Вот тут я готовилась к провалу. Слишком длинное предложение, слишком специфичные термины, да ещё и рукописный шрифт.
А вот тут скандал, о котором писали в обзорах. Модель пишет: "Благодаря MagSafe в iPhone 17e 17e появится быстрая беспроводняя зарядка зарядка мощностью 20-25 Вт". Предложение не полное, забыл дописать, что беспроводная зарядка еще и быстрая. Криво написал слово "мощность", два раза продублировал модель айфона и слово "зарядка". На второй попытке - то же самое, но оборвал предложение после слова "зарядка". На третьей - "появится быстрая беспроводная зарядка" и точка. Модель упирается в лимит символов для текста на картинке и режет предложение, игнорируя, что оно должно быть завершённым. При этом почерк красивый, разборчивый, тетрадь выглядит реалистично. Но задание не выполнено.
Nano Banana Pro справился. С первой попытки. Текст написан от руки, разборчиво, буквы соединены правильно. Предложение полное, ничего не обрезано. Термины все на месте, MagSafe с большой буквы, дефис в "20-25" проставлен. Тетрадь выглядит реалистично - строчка, потёртости на обложке, свет от лампы падает правильно. Единственный нюанс: почерк чуть компьютерный, слишком ровный для школьника. Но это придирки.
Nano Banana Pro сдала тест на русский язык на твёрдую пятёрку. Миф о том, что нейросети не пишут по-русски, можно смело закрывать. По крайней мере, для этой модели. А вот GPT еще стоит доработать пару нюансов.
Тут модели заходят на территорию презентаций и отчётов. Спрос жёсткий: точность данных, читаемость текста, аккуратность.
Nano Banana Pro сделал идеально. Круговая диаграмма, сектора подписаны: "Apple 48%", "Samsung 30%", "Google 12%", "Others 10%". Всё читаемо, ровно, аккуратно. Цвета контрастные, подписи не налезают друг на друга. Можно сразу вставлять в годовую отчётность.
GPT Image 1.5 нарисовал более скудную диаграмму по сравнению с конкурентом. Цвета скучные, нет фона, нет объема.
Но самый главный косяк - отсутствует сектор Others. Есть выноска, но на этом всё. Иконок нет вообще. Тест провален, диаграмму нельзя никому показывать, она нечитаема.
Если вам нужна инфографика для работы, презентаций, отчётов - Nano Banana Pro ваш выбор. GPT Image 1.5 даже не попытался приблизится к правильной генерации.
Проверяем, как модели помнят контекст и аккуратно вносят изменения, не ломая предыдущую картинку.
1 фото в коллаже - кофейня уютная, деревянная, цветы в горшках.
2 фото - модель слегка затемнила небо, добавила серости. Пасмурно не получилось, скорее лёгкая облачность.
3 фото - "добавь надпись Open 24/7". Надпись появилась. Маленькая, на табличке на стойке, еле заметная, если смотреть с лупой, наверное, разглядеть возможно.
4 фото - "красный велосипед". Велосипед появился. Почти у входа, красный.
Есть вопросы к табличке, которая не над дверью, как я просила изначально. И есть вопросы к пасмурной погоде, видимо у модели протест на грусть и тоску.
Кофейня выглядит очень нарисовано, но мне понравилось, довольно интересно.
Фото 2 - солнце ушло, освещение ровное, облачное, тени исчезли. Выглядит как настоящий пасмурный день.
Фото 3 - "Добавь надпись Open 24/7". Над дверью появилась аккуратная световая вывеска. Табличка вписана в архитектуру. Мне в глаза бросилось сильное различие шрифтов двух вывесок на картинке, но это уже мои придирки.
Фото 4 - "Красный велосипед". У входа появился красный велосипед, прислонённый к стене. Вывеска на месте, погода пасмурная, кофейня та же. Но люди теперь сидят почему-то не в кофейне, а на улице. Барная стойка обрезана, общая целостность картинки нарушена.
Вердикт. GPT Image 1.5 понимает идею редактирования, но может спокойно деформировать пространство. Nano Banana Pro создает более реалистичные изображения, но при этом игнорирует расположение объектов. Делает иногда так, как ей хочется.
Это тест на память модели. Многие нейросети рисуют каждого кота заново, не помня, как он выглядел в предыдущем кадре.
Nano Banana Pro справился блестяще. На всех трёх картинках один и тот же кот. Полосатый, рыжий с белым, шляпа коричневая фетровая, глаза желтые. На первой входит в дверь. На второй замер с удивлённой мордой. На третьей прыгает на диван. Диван тоже одинаковый - желтый с подушками. Модель явно запомнила персонажа из первого сообщения и держала его в контексте на протяжении всего диалога.
GPT Image 1.5 также отлично прошла тест. Одинаковые шляпа, одинаковый интерьер, одинаковый кот - все супер.
Вердикт - если вы рисуете истории с одними и теми же героями, то оба инструмента отлично выполнят эту работу.
Хорошо, когда модели рисуют красиво. Но ещё лучше, когда за это не приходится платить как за крыло самолёта.
Nano Banana Pro
Доступ через Google AI Studio или Vertex AI. Есть бесплатный пробный период с ограничениями (около 60 запросов в месяц). Доступна на сайте BotHub.
Стоимость генерации зависит от разрешения. Для изображений 1536x1536 - примерно $0.04 за штуку. Для 4K - около $0.10. На BotHub от $3/мес (тариф Basic - 400 страниц текста) до $49/мес (Elite - 12 000 страниц). Есть корпоративные тарифы.
Подписку можно подключить через Google Cloud, платить по факту. Минимальных ежемесячных платежей нет. Скорость быстрая, лимиты высокие.
GPT Image 1.5
Доступ через ChatGPT Plus/Pro подписку, либо через API OpenAI.
Цены (API) дороже, чем у конкурента. Примерно $0.08 за изображение 1536x1536.
Подписка ChatGPT Plus - $20/мес. Даёт ограниченное количество генераций (примерно 200-300 в месяц, зависит от нагрузки). ChatGPT Pro ($200/мес) снятие почти всех лимитов. Скорость медленнее, лимиты жёстче в дешёвых тарифах.
Если вы генерируете по 10 картинок в день для личного блога:
Nano Banana Pro обойдётся в $12 в месяц (если платить по факту). Либо можно сэкономить, воспользовавшись агрегатором нейросетей BotHub (от $3/мес).
GPT Image 1.5 через API - $24 в месяц.
GPT Image 1.5 через подписку Plus - $20 в месяц, но упрётесь в лимиты, если будете генерировать много.
Если генерируете много и вам важна скорость - Nano Banana Pro выгоднее в 2 раза. Если редактирование и точность важнее скорости, тогда, возможно, стоит переплатить за GPT.
Nano Banana Pro - модель, с которой хочется творить. Она понимает контекст, чувствует юмор, рисует живых людей с настоящими морщинами и правильными пропорциями. Она пишет длинные русские тексты без ошибок, делает аккуратные диаграммы и помнит вашего кота от кадра к кадру. Но если попросить её что-то поправить - может сделать по-своему. Потому что она художник.
GPT Image 1.5 - модель, с которой хочется работать, когда нужен порядок. Она дотошно выполнит инструкции, даже если для этого придётся сдвинуть стены. Она умеет редактировать так, как попросили, а не как ей захотелось. Но живые сцены даются ей тяжело, длинный текст она обрежет, а пропорции может сломать.
Вердикт один:
Модели отлично дополняют друг друга. Держите обе вкладки открытыми. Nano Banana Pro - для души, для творчества, для живых картинок. GPT Image 1.5 - для правок, для точных задач, для ситуаций, когда художник должен забыть о своём я и просто сделать, как просят.
Выбирайте под задачу. Удачи!
Источник

