Google запускает Whisk для быстрого создания изображений, генерируемых искусственным интеллектом, и обновляет Veo 2, Imagen 3

Google запустил свой последний эксперимент с искусственным интеллектом Whisk для тестировщиков Labs, целью которого является предоставление пользователям более быстрого способа создания изображений.
Whisk использует Gemini и Imagen 3 и требует от пользователей загружать изображения, соответствующие трем областям: предмету, сцене и стилю.
В другом месте Google рассказал о новых версиях Imagen 3 и Veo 2, которые выходят сегодня (16 декабря).

Как опытный технический аналитик с более чем двадцатилетним опытом работы за плечами, я должен сказать, что последние эксперименты Google в области искусственного интеллекта просто выдающиеся. Постоянные усилия компании по расширению границ искусственного интеллекта действительно вдохновляют.

"Просто покупай индекс", говорили они. "Это надежно". Здесь мы обсуждаем, почему это не всегда так, и как жить с вечно красным портфелем.

Поверить в рынок

Google начинает неделю с нового эксперимента с искусственным интеллектом в лабораториях, на который могут подписаться пользователи из США.

Согласно недавнему сообщению в блоге, последний тест лаборатории называется «Whisk», и он революционизирует создание изображений, позволяя пользователям вводить изображения вместо написания обширных описаний. Эта функция служит альтернативой, когда слова даются нелегко. По сути, новая модель Google Whisk, в которой используются Gemini и Imagen 3, фокусируется на выявлении нескольких важных аспектов предоставленного изображения.

Первоначально компания просит пользователей предоставить три изображения: по одному для каждого предмета, сцены и стиля, на которых они хотят сосредоточиться.

Модель искусственного интеллекта способна создавать отдельные изображения, такие как игривый морж, напоминающий причудливое изображение, или изображение розовой булавки для пончика на эмали, но Google предупреждает, что ее искусственный интеллект фокусируется только на улавливании фундаментальных аспектов изображений, загруженных пользователем в Whisk.

По словам Google, дизайн Whisk специально не позволяет ему точно копировать то, что вы загрузили. Однако некоторые элементы, такие как рост объекта, прическа и оттенок кожи, могут незначительно измениться. Google признает, что эти характеристики важны для пользователей, поэтому после создания предоставляет возможность «просмотреть и отредактировать», чтобы обеспечить удовлетворение.

Как энтузиаст, я могу сказать, что эта инновация искусственного интеллекта призвана упростить процесс создания изображений по сравнению с традиционными методами. Мало того, Whisk позволяет мне перерабатывать или, как говорят, «ремиксовать» изображения, которые я ввел в их инструмент для создания, порождая новые идеи. После того, как изображение было создано с использованием модели Gemini, Whisk предоставляет подробное описание того, что оно создало.

Тестировщики лабораторий в США могут сегодня (16 декабря) зарегистрироваться в Whisk и опробовать его.

Новые версии Veo и Imagen

В отдельной записи в блоге Google объявил об обновленных версиях Veo 2 и Imagen 3. Начиная с Imagen 3, в сообщении говорится, что он был улучшен для создания более ярких и хорошо структурированных визуальных эффектов. Утверждается, что Imagen 3 теперь более эффективно выполняет ваши инструкции (подсказки), обеспечивая большую детализацию и точность конечных результатов.

Новейшая версия Imagen 3 выходит сегодня (16 декабря) во всем мире в ImageFX в Google Labs.

Самые последние улучшения для Imagen 3 будут реализованы в конце года, примерно через четыре месяца после его скромного дебюта в США на платформах Vertex AI, где Google сделал его более доступным для пользователей. Google подчеркивает меры безопасности, реализованные в Imagen 3 для предотвращения создания незаконных или оскорбительных изображений.

В других местах развертывается обновление Veo 2, расширяющее возможности инструмента создания видео с использованием искусственного интеллекта. Google утверждает, что последняя версия Veo 2 позволяет пользователям создавать видеоролики «исключительно высокого качества» на самые разные темы и стили. Говорят, что Veo 2 может достигать разрешения до 4K и, по слухам, способен воспринимать более сложные описания того, что вы желаете.

Компания показывает, что если пользователь дает Veo 2 указание использовать «объектив 18 мм», ИИ способен понять, как сделать широкоугольный снимок. Кроме того, его способность интерпретировать выражения, действия и другие элементы способствует более захватывающему опыту при создании видеороликов, созданных искусственным интеллектом.

Google также заявляет, что последние обновления Veo 2 помогают «реже галлюцинировать» детали.

16 декабря в VideoFX компании Google Labs выходит обновление для Veo 2, и компания постепенно увеличивает количество пользователей, участвующих в тестировании. Если вы заинтересованы, вы можете присоединиться к списку ожидания, чтобы получать уведомления. Google намекнул на планы представить Veo 2 в YouTube Shorts и на «дополнительных платформах» в следующем году. Ранее в этом году мы узнали об их намерениях интегрировать Veo 2 с YouTube, и это отличная новость!

Смотрите также

2024-12-16 21:53