Google RealFill может стать следующим большим трюком компании в области фотографии с искусственным интеллектом

TLDR

  • Google зарегистрировала товарный знак для технологии RealFill.
  • Технология позволит пользователям расширять изображения на основе до пяти эталонных изображений.
  • Это должно привести к более точному расширению изображения по сравнению с другими решениями.

Как поклонник технологий и фотографии, я рад услышать о новой технологии Google RealFill. Возможность расширять изображения на основе до пяти эталонных изображений меняет правила игры при редактировании изображений. Потенциал более точного расширения по сравнению с другими решениями является многообещающим, и мне не терпится увидеть, как это можно реализовать на практике.


За последние полтора года Google активно демонстрировал свою технологию генеративного искусственного интеллекта, ярким примером которой является Magic Editor. Теперь ходят слухи, что предстоящая крупная функция фотографий Google, интегрированная с искусственным интеллектом, может называться RealFill.

На прошлой неделе Google незаметно подала заявку на регистрацию технологии RealFill через Ведомство интеллектуальной собственности Европейского Союза (EUIPO) и Ведомство по патентам и торговле США (USPTO).

Как заядлый поклонник передовых технологий, я бы описал это так: «Я предлагаю онлайн-решение на базе искусственного интеллекта для создания высококачественных нарисованных изображений без необходимости загрузки какого-либо программного обеспечения. Кроме того, вы можете создавать уникальные генеративные модели, используя мою удобная платформа, доступная через Интернет».

RealFill объяснил

В прошлом году инновационная технология RealFill была представлена ​​в исследовательской работе и сопроводительном веб-сайте совместной командой Google и Корнельского университета. Это новаторское исследование, озаглавленное «Генерация на основе эталонов для создания аутентичных изображений», представляет методологию улучшения и восстановления изображений с большей точностью.

RealFill эффективно улучшает и заполняет недостающие детали исходного изображения с большей точностью, используя для руководства до пяти других изображений.

Эти эталонные изображения не обязательно должны быть совмещены с целевым изображением, их можно снимать с совершенно разными точками обзора, условиями освещения, апертурой камеры или стилями изображения.

Команда первоначально настраивает пользовательскую модель искусственного интеллекта, которая генерирует изображения, используя эталонный и целевой наборы в качестве обучающих данных. Эта адаптация позволяет модели уловить условия освещения, художественный стиль и основные элементы изображенных сцен.

Как аналитик данных, я могу утверждать, что представленные здесь результаты красноречивы сами по себе, о чем свидетельствуют наборы данных, показанные выше и ниже. Более того, представленные изображения предлагают наглядное сравнение RealFill и альтернативных методов, таких как Stable Diffusion.

По своему опыту я заметил некоторые недостатки RealFill. Одним из существенных недостатков является то, что он требует трудоемкого «процесса тонкой настройки на основе градиента» для входных изображений, что может замедлить общий прогресс. Кроме того, достижение единообразного конечного изображения может оказаться сложной задачей, если существует огромное несоответствие между эталонным и целевым изображениями. Более того, исследователи обнаружили, что текст может создавать сложности при реализации этой техники.

Увидим ли мы это на Pixel 9 или Google Photos?

Как аналитик, я бы перефразировал это следующим образом: хотя на RealFill были поданы заявки на патенты или товарные знаки, это не означает автоматически, что оно материализуется в коммерческом продукте для телефонов серии Pixel или Google Photos. Однако, учитывая его потенциальную ценность, разумно предположить, что это может быть частью будущих планов, если оно действительно предназначено для выпуска на рынок.

Более вероятно, что эта функция будет предлагаться через облако, а не как вариант локального редактирования фотографий, учитывая, что команда отметила, что процесс уточнения требует времени.

Как аналитик, я заметил, что современные методы расширения фотографий и рисования нуждаются в улучшении. Потенциальное решение с использованием эталонных изображений могло бы значительно улучшить получаемые нами результаты. Такой подход позволит пользователям повторно просматривать старые фотографии в своей библиотеке Google Фото и создавать улучшенные версии.

Эта характеристика обязательно спровоцирует дальнейшие дискуссии о сущности фотографии, подобно тому, как Magic Editor от Google разжигает дебаты вокруг этой темы.

Смотрите также

2024-04-26 17:56