- Google запустил свой последний эксперимент с искусственным интеллектом Whisk для тестировщиков Labs, целью которого является предоставление пользователям более быстрого способа создания изображений.
- Whisk использует Gemini и Imagen 3 и требует от пользователей загружать изображения, соответствующие трем областям: предмету, сцене и стилю.
- В другом месте Google рассказал о новых версиях Imagen 3 и Veo 2, которые выходят сегодня (16 декабря).
Как опытный технический аналитик с более чем двадцатилетним опытом работы за плечами, я должен сказать, что последние эксперименты Google в области искусственного интеллекта просто выдающиеся. Постоянные усилия компании по расширению границ искусственного интеллекта действительно вдохновляют.
Google начинает неделю с нового эксперимента с искусственным интеллектом в лабораториях, на который могут подписаться пользователи из США.
Согласно недавнему сообщению в блоге, последний тест лаборатории называется «Whisk», и он революционизирует создание изображений, позволяя пользователям вводить изображения вместо написания обширных описаний. Эта функция служит альтернативой, когда слова даются нелегко. По сути, новая модель Google Whisk, в которой используются Gemini и Imagen 3, фокусируется на выявлении нескольких важных аспектов предоставленного изображения.
Первоначально компания просит пользователей предоставить три изображения: по одному для каждого предмета, сцены и стиля, на которых они хотят сосредоточиться.
Модель искусственного интеллекта способна создавать отдельные изображения, такие как игривый морж, напоминающий причудливое изображение, или изображение розовой булавки для пончика на эмали, но Google предупреждает, что ее искусственный интеллект фокусируется только на улавливании фундаментальных аспектов изображений, загруженных пользователем в Whisk.
По словам Google, дизайн Whisk специально не позволяет ему точно копировать то, что вы загрузили. Однако некоторые элементы, такие как рост объекта, прическа и оттенок кожи, могут незначительно измениться. Google признает, что эти характеристики важны для пользователей, поэтому после создания предоставляет возможность «просмотреть и отредактировать», чтобы обеспечить удовлетворение.
Как энтузиаст, я могу сказать, что эта инновация искусственного интеллекта призвана упростить процесс создания изображений по сравнению с традиционными методами. Мало того, Whisk позволяет мне перерабатывать или, как говорят, «ремиксовать» изображения, которые я ввел в их инструмент для создания, порождая новые идеи. После того, как изображение было создано с использованием модели Gemini, Whisk предоставляет подробное описание того, что оно создало.
Тестировщики лабораторий в США могут сегодня (16 декабря) зарегистрироваться в Whisk и опробовать его.
Новые версии Veo и Imagen
В отдельной записи в блоге Google объявил об обновленных версиях Veo 2 и Imagen 3. Начиная с Imagen 3, в сообщении говорится, что он был улучшен для создания более ярких и хорошо структурированных визуальных эффектов. Утверждается, что Imagen 3 теперь более эффективно выполняет ваши инструкции (подсказки), обеспечивая большую детализацию и точность конечных результатов.
Новейшая версия Imagen 3 выходит сегодня (16 декабря) во всем мире в ImageFX в Google Labs.
Самые последние улучшения для Imagen 3 будут реализованы в конце года, примерно через четыре месяца после его скромного дебюта в США на платформах Vertex AI, где Google сделал его более доступным для пользователей. Google подчеркивает меры безопасности, реализованные в Imagen 3 для предотвращения создания незаконных или оскорбительных изображений.
В других местах развертывается обновление Veo 2, расширяющее возможности инструмента создания видео с использованием искусственного интеллекта. Google утверждает, что последняя версия Veo 2 позволяет пользователям создавать видеоролики «исключительно высокого качества» на самые разные темы и стили. Говорят, что Veo 2 может достигать разрешения до 4K и, по слухам, способен воспринимать более сложные описания того, что вы желаете.
Компания показывает, что если пользователь дает Veo 2 указание использовать «объектив 18 мм», ИИ способен понять, как сделать широкоугольный снимок. Кроме того, его способность интерпретировать выражения, действия и другие элементы способствует более захватывающему опыту при создании видеороликов, созданных искусственным интеллектом.
Google также заявляет, что последние обновления Veo 2 помогают «реже галлюцинировать» детали.
16 декабря в VideoFX компании Google Labs выходит обновление для Veo 2, и компания постепенно увеличивает количество пользователей, участвующих в тестировании. Если вы заинтересованы, вы можете присоединиться к списку ожидания, чтобы получать уведомления. Google намекнул на планы представить Veo 2 в YouTube Shorts и на «дополнительных платформах» в следующем году. Ранее в этом году мы узнали об их намерениях интегрировать Veo 2 с YouTube, и это отличная новость!
Смотрите также
- Аниме «Возможно, величайший алхимик всех времен» раскрывает превью новой серии 1 в преддверии январской премьеры
- Обзор Fiio SR11: доступный сетевой стример с интеграцией Roon
- Google до сих пор не исправил задержку уведомлений на пикселях, но вы можете попробовать это
- Какой цвет Galaxy S24 лучший? Мы проверили их все
- Беспроводные наушники Sony WH-1000XM6 планируют выпустить в 2025 году
- Лучшие фильмы десятилетия в формате Dolby Atmos (на данный момент) для проверки вашего домашнего кинотеатра
- Можно ли использовать поврежденное устройство Stellar Blade после «Неизвестного подарка»?
- OnePlus продолжает добавлять вредоносное ПО в OnePlus 12 и OnePlus Open, свои флагманы премиум-класса.
- Лучшие телефоны для людей, чувствительных к ШИМ/мерцанию, 2024 г.
- 1Еще обзор SonoFlow Pro HQ51: бюджетные наушники стоят каждой копейки
2024-12-16 21:53