Что такое Nano Banana и почему о нем все говорят?

Что такое Nano Banana и почему о нем все говорят?

По факту это нейрофотошоп на базе Gemini от компании Google. Пока единственный в своем роде инструмент, способный создавать и редактировать изображения с большой точностью. Означает ли это, что в ближайшем будущем все фоторедакторы станут бесполезны?

Обновленная генеративная модель от Google — не волшебная палочка, хотя очень старается ею казаться. Она способна создавать изображения в разрешении до 4К и может точечно их изменять, не теряя контекста. Уже это делает ее куда функциональнее Midjourney, который до сих пор считался лучшей генеративной моделью для фотореалистичных изображений. Однако такие изменения не проходят без потерь и прочих проблем, свойственных нейросетевой генерации.

Разберем на примере.

Дадим нейронке следующий промпт: «Создай фотореалистичное изображение молодого парня в бежевой кожаной куртке. На самой куртке должны быть нашивки с предупреждающими знаками. Его лицо спокойно и выражает уверенность. Средний план: городской пейзаж на фоне мягкого, рассеянного освещения. В руке парень держит стаканчик с кофе».

Что такое Nano Banana и почему о нем все говорят? | London Cult.
Фото: Гай Серегин

Получился такой «охотник за привидениями». Но на подобную генерацию способны и другие модели. Настоящая магия начинается, когда мы вносим существенные и детальные изменения. Скажем, персонажу нужно поменять прическу и пусть он смотрит в сторону.

Илл 2

Что такое Nano Banana и почему о нем все говорят? | London Cult.
Фото: Гай Серегин

На первый взгляд может показаться, что нейросеть справилась с задачей идеально. Это тот же персонаж в том же сеттинге, но после внесения изменений качество текстур лица ухудшилось. Появилась легкая, но видная глазу запыленность. И чем больше мы будем вносить изменений, тем заметнее начинает падать качество.

Теперь внесем существенные изменения и перенесем нашего «охотника» в другую среду со следующим промптом: «Пусть он не идет по улице, а стоит посреди пустыни рядом с разбитой пожарной машиной. Измени выражение лица персонажа на уставшее, убери стаканчик с кофе и запачкай куртку маслом и сажей».

Что такое Nano Banana и почему о нем все говорят? | London Cult.
Фото: Гай Серегин

Вот и все. На этом примере хорошо видны пределы возможностей Nano Banana. Да, он может создать новый фон, вырезать персонажа из исходного изображения и поместить его в новую среду, но делает это на уровне человека, который в первый раз открыл Photoshop. Поехало все: освещение, пропорции, даже анатомия. Что уж говорить о фотореалистичности текстур? В тех местах, где куртку покрыли пятна, виден чудовищный блюр. То же самое можно сказать и о текстуре кожи. Подобные искажения прямо пропорциональны количеству изменений и точности промпта. В целом это означает, что Nano Banana не только не способен заменить человека с навыками Photoshop, но и едва ли может сильно облегчить ему работу.

Для завершения теста попросим нейросеть исправить изображение, хотя бы выровняв свет и композицию. Предложим нейросети такой вариант: «Пусть человек на фото сидит на земле, прислонившись к машине спиной. Он должен смотреть на зрителя. Поправь свет и композицию. Повысь качество текстур и сделай изображение более реалистичным».

Что такое Nano Banana и почему о нем все говорят? | London Cult.
Фото: Гай Серегин

В целом, это можно назвать успехом. Да, текст на одной из нашивок превратился в несуразный бред, а лицо персонажа лишь немного напоминает нашего «охотника» из первой генерации, но зато немного поправился свет и текстура куртки. Большинство этих проблем можно решить вручную.

Итоги: в качестве отдельного инструмента, вшитого в Photoshop, Nano Banana покажет себя хорошо в некоторых задачах. Особенно в точечном изменении фото. Главное не переборщить с количеством редакций и не требовать от нейросети чего-то сверх сложного. Еще лучше генерировать изображение в максимальном качестве, а затем самостоятельно его выравнивать на отдельных участках.

Ещё в London Cult.