Вот как Gemini позволит вам точно настроить сгенерированные изображения (разбор APK)

Вот как Gemini позволит вам точно настроить сгенерированные изображения (разбор APK)

TLDR

  • Google работает над возможностью точного редактирования изображений, созданных искусственным интеллектом и созданных с помощью Google Gemini.
  • Мы активировали эту функцию и подготовили демо-версию, чтобы показать вам, как функция точного редактирования будет работать в Google Gemini.

Как аналитик с многолетним опытом работы в области искусственного интеллекта и машинного обучения, я должен сказать, что развитие точного редактирования изображений в Google Gemini — это значительный шаг вперед. Это как наблюдать за тем, как малыш учится рисовать по номерам, а затем внезапно получает возможность раскрашивать за пределами линий — это увлекательно!


Как и многие другие чат-боты с искусственным интеллектом, Google Gemini может создавать изображения на основе текстовых подсказок. Но настройка или уточнение изображения после его создания не слишком удобно для пользователя. Вам нужно ввести больше текстовых команд, чтобы изменить вывод, но нет возможности выборочно редактировать определенные части изображения. В настоящее время Google разрабатывает функцию, которая позволит осуществлять точное редактирование, позволяя выбирать, и у нас есть демонстрация на Android, чтобы проиллюстрировать, как это будет работать.

В последней бета-версии приложения Google для Android (бета-версия 15.40.31.29) мы теперь можем включить усовершенствованную функцию редактирования изображений в Gemini. Хотя он все еще находится в стадии разработки, в него были внесены улучшения, которые сделали его более эффективным, чем раньше. Посмотрите, как это работает, в демонстрационном видео ниже:

В представленной демонстрации текстовые подсказки используются для создания изображений. Как и в случае с другими генераторами изображений, подробная информация в первоначальном приглашении помогает создать изображение, которое точно соответствует тому, что вы желаете. Однако если необходимо внести изменения, можно использовать дополнительные подсказки для внесения изменений. Эти корректировки могут применяться ко всему изображению или нацеливаться на определенные области изображения с помощью более целенаправленной подсказки редактирования.

Несмотря на то, что демонстрация демонстрирует явные улучшения, важно отметить, что изменения не всегда идеальны и не могут быть полностью надежными. Например, даже простые изменения, направленные на добавление второстепенных объектов, могут случайно изменить основной объект (например, собаку в данном случае). В некоторых случаях все изображение может претерпеть значительные изменения. К счастью, у вас есть возможность вернуться к предыдущей версии, если вас не устраивают недавние изменения.

После завершения и доработки изображения просмотр хода редактирования будет напоминать обычный диалог чат-бота в вашем журнале чата. Чтобы возобновить редактирование, просто нажмите на любое изображение, созданное в ходе разговора.

Вот как Gemini позволит вам точно настроить сгенерированные изображения (разбор APK)

Имейте в виду, что мы переработали видео, устранив задержки, связанные с созданием изображений, которые при использовании Gemini Advanced составляли в среднем более 10 секунд на изображение. Поэтому не забудьте выделить определенное время на обработку каждого редактирования.

Как технический энтузиаст, я очень рад наблюдать за прогрессом в создании изображений в Gemini, особенно в усовершенствованном инструменте редактирования. Определенно есть куда доработать, но все складывается довольно хорошо! Я не могу дождаться, когда Google скоро сделает эту функцию доступной для всех пользователей. Мы надеемся, что внедрение произойдет быстро!

Смотрите также

2024-10-08 10:17