Google Imagen 3 теперь открыт для всех в США

Согласно исследованию Google, Imagen 3 является лучшим по производительности, создавая высококачественные изображения из текста и превосходя другие модели в тестах.
Imagen 3 улучшил понимание запросов пользователя и включает меры защиты от создания оскорбительного или незаконного контента, в отличие от более спорного Grok-2 от xAI.
Отзывы показывают, что Imagen 3 имеет более строгие ограничения по сравнению с предыдущими моделями, вероятно, в ответ на проблемы с более ранней моделью Google Gemini.

Как опытный наблюдатель с многолетним опытом работы в технологической отрасли, я должен сказать, что тонкое, но стратегическое внедрение Google Imagen 3 весьма интригует. Похоже, они извлекли уроки из своего прошлого опыта, особенно с моделью Gemini, и на этот раз применяют более осторожный подход.

"Просто покупай индекс", говорили они. "Это надежно". Здесь мы обсуждаем, почему это не всегда так, и как жить с вечно красным портфелем.

Поверить в рынок

Как технический энтузиаст, я только что заметил захватывающее событие: Google тайно распространил Imagen 3, свой модернизированный генератор изображений на основе искусственного интеллекта, по Соединенным Штатам без какого-либо торжественного открытия! Это означает, что теперь многие из нас могут поиграть с этой усовершенствованной моделью и изучить ее возможности. Какое время жить!

Согласно статье VentureBeat, исследовательская работа, автором которой является Google, представляет Imagen 3, замечательную модель скрытой диффузии, способную генерировать первоклассные изображения на основе текстовых инструкций. Примечательно, что в документе указывается, что Imagen 3 превосходил другие модели по производительности во время различных тестов.

На своей конференции I/O в мае Google впервые представила свой сложный генератор изображений. Однако только в этом месяце они широко выпустили его на своей платформе Vertex AI.

Технический гигант объявил о значительных улучшениях в способности Imagen 3 эффективно понимать инструкции пользователя. Подобно другим генераторам изображений ИИ, он может создавать сложные визуальные эффекты на основе текстовых описаний; однако существуют ограничения, когда речь идет о создании оскорбительного или незаконного контента. Чтобы предотвратить неправильное использование, система не позволяет генерировать изображения общественных деятелей или любые изображения, связанные с оружием.

Вместо этого: «Он отличается от Grok-2 из xAI, поскольку имеет меньше ограничений и получил известность из-за ассоциации с сомнительными изображениями в Интернете».

Отзывы пользователей показывают, что новая модель Imagen 3 имеет более строгие ограничения по сравнению со своими предшественниками, что можно объяснить растущими сложностями при создании изображений с помощью искусственного интеллекта. Эти инструменты вызывают постоянные дискуссии, поскольку они регулярно создают контент, который привлекает внимание, вызывает дебаты или вызывает разные мнения на платформах социальных сетей.

Похоже, что Google осторожно подходит к запуску Imagen 3, но остается неясным, сохранят ли они эту осторожную позицию по мере дальнейшего развития модели.

Осторожное отношение Google к Project Imagen 3 потенциально может быть связано с критикой, с которой компания столкнулась в адрес модели Gemini в начале этого года. После создания исторически неверных изображений с предвзятым изображением расовых групп Google временно приостановил процесс создания изображений, чтобы исправить эти проблемы.

Кроме того, компания из Маунтин-Вью заявила, что Imagen 3 будет доступен в нескольких модификациях, предназначенных для различных приложений, таких как быстрое рисование или создание детальных изображений высокой четкости.

Пользователи имеют возможность точно настроить изображения, выбрав определенные зоны и предоставив подробные инструкции. Чтобы изучить эту функцию, перейдите на веб-страницу Google AI Test Kitchen, войдите в систему, используя свою учетную запись Google, и углубитесь в платформу.

Смотрите также

2024-08-19 04:53