Gemini Nano Banana подстригла мне бороду и вызвала солнечный ожог, но я все равно люблю ее.

В течение некоторого времени я экспериментировал с редактором изображений Nano Banana от Google, который они представили несколько недель назад. Этот инструмент решает значительную проблему, с которой я столкнулся при редактировании изображений в Gemini: каждый раз, когда я пытался внести незначительные коррективы с помощью запросов, ИИ создавал совершенно новое изображение вместо этого.

"Просто покупай индекс", говорили они. "Это надежно". Здесь мы обсуждаем, почему это не всегда так, и как жить с вечно красным портфелем.

Поверить в рынок

Раньше мне приходилось оставлять многие настройки без внимания при работе с несколькими изображениями из-за отсутствия инструмента, который мог бы точно изменять небольшие детали, сохраняя остальное нетронутым. Теперь это больше не проблема с Nano Banana. Мне удалось тонко настроить множество незначительных аспектов в различных изображениях с помощью этого инструмента, и в целом он справляется со своей задачей. Однако, как и любое программное обеспечение, оно не идеально. Есть некоторые особенности, которые я рассмотрю в этой статье, чтобы предоставить четкое понимание его возможностей и ограничений.

Тест номер 1: Что с солнечным ожогом, Близнецы?

На прошедших выходных я наслаждался живописной красотой озера Блед прямо здесь, в Словении. Как это часто бывает, моя галерея заполнилась множеством снимков, сделанных во время этого прекрасного путешествия. Эти фотографии, казалось, идеально подходили для проверки эффективности новейшего инструмента для редактирования изображений, который мне попался.

Вместо того, чтобы загружать все изображения сразу, я загружал фотографии по отдельности — одна, где я стою у озера на фоне живописного замка, а затем начал тщательно редактировать каждую из них, используя отдельные запросы для каждого желаемого изменения.

Я попросил Gemini внести несколько изменений: обменять мои умные часы на Rolex Datejust, изменить цвет моей рубашки на темно-синий и украсить ее логотипом Louis Vuitton, обновить мои очки до современных белых и добавить несколько племенных татуировок, чтобы придать более суровый вид. Кроме того, я хотел, чтобы Gemini сделал воду в озере более яркой и добавил небольшую лодку с двумя людьми в ней.

В целом, Nano Banana продемонстрировала выдающиеся результаты. Должен признать, она превзошла мои ожидания, особенно в сравнении с предыдущей моделью. За исключением одного случая, который я объясню позже, она никогда не затрагивала другие элементы на изображении. Ее скорость и эффективность были достойны похвалы, и поначалу изменения, которые она вносила, были настолько безупречными, что даже экспертам было трудно поверить в участие искусственного интеллекта. Тем не менее, ее ограничения стали очевидны со временем.

Во время этого теста я столкнулся с множеством трудностей. Например, искусственный интеллект неправильно понял мои инструкции и разместил татуировку на неправильной руке, в то время как предполагалось, что на левой. После нескольких попыток с более конкретными указаниями мне удалось исправить эту проблему, хотя в итоге я решил разместить их обе на руках. Ему также изначально было сложно, когда я попросил его стереть татуировку, однако он подчинился после дополнительных подсказок.

Независимо от причины, Нано Банан, казалось, не желал способствовать росту моих мышц, несмотря на неоднократные попытки. Набор массы и мышц представляется мне недостижимым, и похоже, что искусственный интеллект тоже не является решением. Полагаю, мне просто суждено оставаться таким, какой я есть.

Одна из проблем возникла, когда я попросил искусственный интеллект улучшить растительность вокруг озера. Хотя ему это удалось, как показано на изображении выше, он также изменил другие элементы, такие как удаление замка и острова, украшенного церковью — да, это действительно остров — и замена их большой горой на заднем плане. Иронично, но гора, которую он выбрал, напоминает тот же хребет, который я вижу со своего местоположения на фотографии, что позволяет предположить, что он мог взять ее из одной из моих других фотографий, хранящихся в Google Фото. Я не был впечатлен этим изменением и попросил искусственный интеллект отменить свои действия, что он выполнил без каких-либо проблем.

Другие проблемы возникают из-за того, что структура, похожая на замок, на холме была изменена искусственным интеллектом на нечто больше похожее на маленький, обветшалый коттедж. Кроме того, нет никакого объяснения, почему мою бороду внезапно подстригли. Просто ради развлечения, похоже, что Gemini намеренно дала мне солнечный ожог на лице, несмотря на то, что день не был особенно жарким.

Стоит отметить четкость изображения. По мере того, как искусственный интеллект вносил больше изменений, разрешение изображения заметно ухудшалось, что отчетливо видно при сравнении исходного и конечного изображений.

Тест номер 2: Я поставил всё на кон.

Первоначально размытый результат первоначальной попытки озадачил меня, побудив выяснить источник проблемы. У меня было предчувствие, что проблема может заключаться в чрезмерном вмешательстве в различные аспекты, особенно в чрезмерной концентрации на одном элементе — изображении, на котором был я.

Принимая это во внимание, я повторно загрузил идентичное изображение и попросил внести все изменения сразу в четком и лаконичном запросе. Интересно, что этот подход дал значительные улучшения, поскольку полученное изображение стало заметно менее зернистым. Однако, казалось, что не все изменения были успешно реализованы.

Проще говоря, ничего существенного не изменилось – мои часы остались прежними, цвет моей рубашки не изменился, и оттенок воды не стал темнее. Однако, похоже, Gemini наконец-то удалось правильно определить левую руку, так что молодец!

Джемини отказался подарить мне часы Rolex.

Первоначально вместо белых очки пришли синими — ошибка с моей стороны при предоставлении инструкций. Затем я попросил искусственный интеллект изменить различные аспекты: изменить цвет очков, углубить оттенок воды и моей рубашки, и виртуально поместить потрясающие часы Rolex на мое запястье. Хотя Nano Banana успешно справилась со всеми остальными задачами, она упорно отказывалась предоставить мне желаемые часы, даже после неоднократных просьб.

Хотя финальное изображение все еще содержало некоторую зернистость, она была менее заметна, чем в первой попытке. Чтобы улучшить результат, я добавил ожерелье и сделал стрижку. Кроме того, я попросил искусственный интеллект отрастить более густую бороду, поскольку в первом тесте он ее подстриг. Возможно, я немного перестарался, но мне очень понравилось использовать этот инструмент, и я довольно доволен результатом, хотя он и не был полностью безупречным.

Тест номер 3: Людей не допускать

Вместо того, чтобы концентрироваться на себе, я решил сделать захватывающий дух снимок природы. Поднявшись на холм, я добрался до замка, где сделал потрясающий кадр близлежащего озера. Выбрав его в качестве объекта, я начал редактировать и улучшать изображение, чтобы раскрыть его лучшие качества.

Поначалу уменьшение количества запросов привело к менее четкому изображению. С самого начала я запросил несколько корректировок, таких как сделать воду более голубой, добавить орла на скалистом выступе, включить разнообразные лодки на воду и добавить горы на горизонте. Я был поражен тем, как хорошо искусственный интеллект интегрировал горы за холмами, что затрудняло определение того, что это не часть реальной фотографии. Лодки выглядели довольно стандартно, поэтому я попросил больше разнообразия, и моя просьба была удовлетворена. Хотя конечный результат не был идеальным, он определенно показал улучшение.

Кроме того, я попросил добавить параплан на заднем плане сцены, а также водопад, каскадом спускающийся с холма за островной церковью. Параплан был добавлен плавно, но изначально водопад казался расположенным неправильно, словно стекал прямо из деревьев из-за его размещения с неверной стороны холма. Затем я попросил Gemini повысить реалистичность, добавив скалистую стену за водопадом, что им удалось. Хотя очевидно, что изображение сгенерировано искусственным интеллектом, в целом это неплохая работа.

Возможно, я внес еще некоторые коррективы, но в целом я довольно доволен тем, что получилось. Конечно, есть потенциал для дальнейшей доработки.

Тест номер 4: Объединение изображений

Одной из выдающихся особенностей Nano Banana является ее способность объединять две фотографии в одну. После нескольких попыток я пришел к выводу, что Gemini нуждается в улучшении в этом конкретном аспекте.

На предоставленном изображении, кажется, есть несоответствие. Я попросил ИИ сгенерировать сцену, где я и моя вторая половинка прогуливаемся рука об руку у озера. Однако, в этом результате мы не держимся за руки, как и предполагалось. Вместо этого, ИИ включил исходное изображение меня, но неуклюже вставил его в новую обстановку, из-за чего общая композиция кажется неестественной с точки зрения моей эстетики.

После этого я попросил его создать изображение, на котором мы наслаждаемся совместной трапезой. Из всех сгенерированных изображений это выделилось как наиболее удачное, несмотря на то, что наши подобия не были переданы идеально. Тем не менее, это была довольно впечатляющая попытка.

К сожалению, после этого ситуация ухудшилась. Следующие две картинки были не очень удачными, так как они не смогли точно нас изобразить. На одной кажется, что мы участвуем в марафоне, а на другой — что танцуем на вечеринке. Честно говоря, я не был доволен, потому что в них не было ни малейшего сходства с нами настоящими.

Тест номер 5: Превратите меня в игрока НБА

Nano Banana предназначен для кардинального изменения обстановки на фотографии. Например, он может захватить ваше изображение и превратить вас в адвоката в зале суда, сохраняя при этом черты вашего лица. Я попытался его использовать, надеясь на улучшение результатов по сравнению с последним разом, но, к сожалению, Gemini снова не оправдал ожиданий.

Я отправил автопортрет и попросил преобразовать меня в повара пиццерии, игрока НБА и матадора на арене. Изображения получились удачными, но люди на фотографиях едва похожи на меня. Есть некоторые сходства, но они скорее общие приближения, чем точные изображения. Изображение игрока НБА оказалось наиболее близким соответствием, а портрет повара пиццерии получился не очень удачным. Я не вижу там особого сходства, но с хорошей стороны, на этот раз я получил дорогие часы, не прося об этом.

Я попытался сделать фотографии крупным планом, чтобы искусственный интеллект мог создать более точное мое представление, но у меня не получилось.

Тест номер 6: Это не только для загруженных изображений.

К сведению, важно отметить, что функциональность редактирования не ограничивается только изображениями, которые вы загружаете. Фактически, у вас есть возможность попросить Gemini создать изображение с нуля, а затем изменить незначительные детали в нем, оставив остальную часть сцены без изменений.

Например, я создал изображение, на котором кот прогуливается по лесной тропинке. Впоследствии я изменил цветовую схему изображения, сделав кота полностью белым, с черным кончиком хвоста и лапами. Кроме того, я изменил цвет глаз кота и перешел к зимней тематике для более подходящего внешнего вида. Корректировки получились безупречными, что подтверждается изображениями, представленными выше.

Итак, каков окончательный вердикт?

У Nano Banana есть некоторые недостатки, которые меня не впечатлили. Например, он иногда делает зернистые фотографии, что разочаровывает. Кроме того, я обнаружил, что он довольно непредсказуем — он неожиданно подстриг мою бороду и даже устроил мне нежелательный солнечный ожог. Что касается его функции объединения изображений, я не добился особого успеха во время тестирования. Изменение сцены на фотографии с человеком также не дало удовлетворительных результатов.

Действительно, мои ожидания оказались не слишком далеки от истины, учитывая новизну этой затеи. Первые шаги Google в редактировании изображений без перестройки всей сцены произвели на меня довольно сильное впечатление. Учитывая стремительные темпы развития технологий искусственного интеллекта, я не сомневаюсь, что в ближайшем будущем они будут продолжать значительно совершенствоваться.

По сути, этот инструмент невероятно полезен для быстрой и эффективной корректировки ваших фотографий, особенно когда инструкции подробные. Я обнаружил, что чем конкретнее инструкция, тем лучше результат. Преимущество заключается в том, что если вы не удовлетворены внесенным изменением, его легко отменить и попробовать снова, используя другие указания.

Эффективность результата, по-видимому, обусловлена сочетанием исходного изображения, необходимых правок и используемых запросов. Возможно, потребуется некоторое время на эксперименты, чтобы добиться совершенства, но когда это получится, результаты могут быть поистине впечатляющими. Подумайте, сколько труда потребовалось бы, чтобы изменить цвет рубашки или заменить очки, используя традиционные методы редактирования. Даже при использовании этих методов результаты могут быть не такими хорошими, как предлагает Nano Banana, учитывая ваш уровень мастерства.

Безусловно, я считаю Nano Banana весьма впечатляющим и думаю, вам определенно стоит его попробовать – он даже бесплатный! Обычно пользователи не запрашивают множество правок для одного изображения, как правило, останавливаясь всего на нескольких. В таких случаях качество изображения хорошо сохраняется без видимых признаков манипуляций искусственным интеллектом.

Смотрите также

2025-09-13 12:50