За последние пару недель я тщательно тестировал возможности генерации изображений у последней модели от Google — ImageIn 4. Ранее мне довелось исследовать её предшественника, ImageIn 3, в рамках Gemini от Google в ноябре. Хотя это было увлекательно, вскоре я столкнулся с ограничениями этой версии. Теперь рад поделиться своими впечатлениями об обновлённой версии, ImageIn 4.
"Просто покупай индекс", говорили они. "Это надежно". Здесь мы обсуждаем, почему это не всегда так, и как жить с вечно красным портфелем.
Поверить в рынокЯ считаю, что последняя итерация показывает значительный прогресс, так как многие проблемы, с которыми я столкнулся в версии три, были устранены. Однако все еще есть несколько раздражающих моментов, которые означают, что она пока не идеальна согласно моим ожиданиям.
Так что же улучшилось?
В целом, качество вывода изображений значительно улучшилось, хотя и не кардинально. Вначале изображение №3 умело генерировало довольно качественные портреты людей, животных и пейзажи; однако последняя версия стабильно создает более четкие и детализированные изображения.
Что касается создания человеческих образов, то Gemini Advanced является единственным вариантом, но я постоянно сталкивался с трудностями при использовании Image 3: он давал чрезмерно карикатурные фотографии даже при желании добиться реалистичного стиля. Попытки исправить это и сделать изображения более живыми чаще всего оказывались безрезультатными. К счастью, использование Image 4 стало для меня переломным моментом, так как теперь она стабильно генерирует очень профессиональные изображения людей – хотя иногда они могут выглядеть слишком отполированными, что мы обсудим позже.
Среди главных неудобств с предыдущей версией была ограниченная возможность регулировать пропорции кадров. Часто оказывался вынужденным ограничиваться квадратными изображениями 1:1, что существенно снижало их универсальность. Они не подходили для веб-публикаций и были неудобны для печати в стандартной фоторамке.
9, 9:16 или 4:3. Эта долгожданная функция существенно улучшает адаптивность и удобство использования сгенерированных изображений.
Исходя из моего опыта, Изображение 4 работает гораздо более гладко. Хотя пока не было значительных улучшений скорости – они упоминают модель быстрее на горизонте – частота ошибок значительно снижена. Раньше Gemini иногда выдавал сообщение об ошибке, объясняя это невозможностью создать изображение по неустановленной причине. Однако я не сталкивался с такими проблемами при использовании Изображения 4. Оно просто функционирует без сбоев.
Всё ещё выглядит немного слишком отретушированным
Хотя Image Engine 4 обеспечивает лучшее качество изображения, большую надежность и гибкость при различных соотношениях сторон, некоторые проблемы, возникшие во время тестирования предыдущей версии, сохраняются.
Я нахожу это сложным потому что изображения которые я получаю не обладают желаемым уровнем реализма особенно когда речь идет о близких планах людей и животных. Картины часто выглядят чрезмерно насыщенными, а также демонстрируют сильный боке эффект профессионально размывая фон. Кажется будто они были сделаны опытным фотографом, в то время как я просто снимаю свою кошку камерой.
Как энтузиаст технологий, я всегда ценил эстетику, но что действительно меня возбуждает — это идея ‘аутентичного режима’. Эта функция позволит создавать изображения с менее идеальными условиями освещения и персонажами, которые не выглядят как профессиональные модели в модельной позе. Я попросил Gemini придать изображению более аутентичный вид путем уменьшения эффекта боке и снижения общей полировки. Искусственный интеллект попытался сделать это, но после неоднократных просьб об улучшении того же самого изображения казалось, что он достиг своего максимума возможностей и больше не может улучшить результат. Каждое новое изображение становилось немного более повседневным, однако было заметно, что оно все еще является результатом генерации искусственным интеллектом — явное свидетельство его способностей.
На изображениях слева направо вы заметите, что первое показывает выраженный эффект боке и мужчину с исключительно чистой кожей. Следующие два образа показывают этого же человека старше и уставшим. В последнем изображении даже видны признаки потери волос. Это не совсем то, чего я ожидал от Gemini при попытках сделать изображение более реалистичным, но оно действительно создаёт непринуждённую атмосферу.
Изображение 4 отлично справляется с генерацией случайных изображений, таких как ландшафты и городские виды издалека. Из-за далекой перспективы эти изображения лишены мелких деталей, что делает их более аутентичными. Однако его производительность может быть непредсказуемой. Изображение Сиднейской оперы получилось удачным, насыщенность была усилена, трава выглядела особенно зеленой, а вода кристально чистой, но немного переборщили с синим цветом для реализма. С другой стороны, при попытке создать изображение Гранд-Каньона получился искусственный результат, который никто бы не принял за настоящую фотографию. Однако после нескольких попыток качество улучшилось.
Редактирование лучше, но еще не идеальное
Одна из проблем предыдущей модели заключалась в её неловких модификациях. Когда меня просили внести незначительные изменения – например, поменять цвет шляпы – ИИ выполнял просьбу, но создавал совершенно новое и несвязанное изображение. Вместо этого я бы предпочёл систему, где сначала можно создать изображение, а затем точно отредактировать каждую деталь по своему усмотрению, будь то замена предметов одежды, добавление конкретных объектов или изменение погодных условий без воздействия на другие аспекты изображения.
Изображение 4 немного выделяется в этом аспекте, но не значительно. При просьбе изменить цвет куртки на синий оно создало новое изображение. Занятно, что когда было дано указание сохранить все остальные детали неизменными, оно успешно удержало большую часть сцены и объекта из оригинального изображения. Это то, что произошло в представленных ранее случаях. В третьем изображении женщина была идентична себе прежней, она находилась примерно в той же обстановке, но её поза и перспектива камеры отличались, указывая на пересъёмку вместо редактирования.
Вот ещё один пример с изюминкой: на этот раз я попросил Gemini изменить цвет эскимо (поп-сикла), что оно и сделало, сохранив при этом большинство оригинальных деталей. Кошка осталась неизменной, равно как и большая часть её окружения. Однако вы заметите, что уши кошки теперь выглядят более выступающими, а ее шапка получила новый дизайн. В общем, достойная попытка!
Несмотря на свои недостатки, Imagene 4 является отличным инструментом.
Несмотря на свои недостатки и список желаемых функций, которые еще предстоит реализовать, ImageN 4 остается одним из лучших генераторов изображений на основе искусственного интеллекта на рынке. Многие проблемы, о которых я упомянул, характерны также для других программ генерации изображений с использованием AI, поэтому Gemini не обязательно отстает в конкурентной борьбе. Похоже, существуют значительные технические препятствия, которые необходимо преодолеть, чтобы эти инструменты могли достичь более высокого уровня точности и реализма.
С моей точки зрения остаются определённые ограничения, например, невозможность создания портретов известных людей или контента, нарушающего стандарты безопасности Google. Является ли это выгодным или невыгодным — зависит от вашей точки зрения. Для тех, кто стремится к меньшим ограничениям, доступны альтернативы, такие как Grok.
Вы уже опробовали новый инструмент генерации изображений в Gemini? Мне было бы интересно услышать ваше мнение. Не стесняйтесь делиться ниже!
Смотрите также
- 10 лучших чехлов, которые обязательно нужно иметь для вашего нового Samsung Galaxy S25 Ultra!
- Лучшие телефоны для людей, чувствительных к ШИМ/мерцанию, 2024 г.
- Первые 11 вещей, которые нужно сделать с Samsung Galaxy Watch Ultra
- Обзор Fiio SR11: доступный сетевой стример с интеграцией Roon
- Лучшие фильмы десятилетия в формате Dolby Atmos (на данный момент) для проверки вашего домашнего кинотеатра
- Какой цвет Galaxy S24 лучший? Мы проверили их все
- Лучшие телефоны Android для студентов 2024 года
- Обзор XGIMI MoGo 3 Pro: поднимаем планку портативных проекторов
- Подойдет ли Samsung Galaxy S25 к чехлам Galaxy S24?
- Какой цвет Samsung Galaxy S25 Ultra выбрать?
2025-06-22 17:18