OpenAI может анонсировать нового мультимодального помощника, который будет напрямую конкурировать с Google

TLDR

В понедельник OpenAI проводит мероприятие, на котором может быть анонсирован новый мультимодальный цифровой помощник.
Мультимодальность позволит помощнику использовать изображения для подсказок, например, для идентификации и перевода знака в реальном мире.
Это будет прямая угроза цифровым помощникам Google, а именно Google Assistant и новому Gemini.

Как исследователь с опытом работы в области искусственного интеллекта и опытом отслеживания тенденций в сфере высоких технологий, я нахожу слухи, окружающие предстоящее мероприятие OpenAI, особенно интригующими. Потенциальный запуск мультимодального цифрового помощника действительно может представлять значительную угрозу для цифровых помощников Google, таких как Google Assistant и новый Gemini.

"Просто покупай индекс", говорили они. "Это надежно". Здесь мы обсуждаем, почему это не всегда так, и как жить с вечно красным портфелем.

Поверить в рынок

В последние недели ходили слухи, что OpenAI, новатор ChatGPT, находится на грани внедрения поисковой системы, управляемой искусственным интеллектом. Такое развитие событий потенциально может стать серьезной проблемой для давно сложившегося поискового бизнеса Google. Учитывая быстрый рост популярности ChatGPT, это станет первой серьезной конкуренцией поиску Google за многие годы.

Согласно недавним сообщениям The Information, предстоящее мероприятие OpenAI в понедельник, возможно, больше не будет включать в себя презентацию поисковой системы. Вместо этого ходят слухи, что OpenAI может представить мультимодального цифрового помощника. Хотя этот помощник и не является обычной поисковой системой, он позволит пользователям находить информацию с помощью искусственного интеллекта, что станет потенциальным вызовом доминированию Google на поисковом рынке.

Мультимодальная система искусственного интеллекта способна обрабатывать различные формы данных, помимо текстовой информации. Например, этот гипотетический цифровой помощник может быть подключен к камере и расшифровывать детали реального мира, например, распознавать и переводить знаки на иностранном языке. Результатом будет звуковой ответ ИИ, предоставляющий вам дополнительную информацию о том, что он обнаружил.

Как исследователь, я заметил, что некоторые технологии, в том числе Google Lens, Google Assistant и последнее дополнение Google Gemini, способны обрабатывать визуальные и слуховые входные данные для предоставления ответов. ChatGPT в настоящее время предлагает аналогичные функции, но через другие интерфейсы. С запуском в понедельник Google может представить улучшенную модель GPT, которая обеспечивает более быстрые и точные ответы, используя как распознавание изображений, так и голосовой ответ в одном приложении. По сути, это может означать появление грозного конкурента Google Gemini (и, следовательно, Google Assistant и Apple Siri).

Важно отметить, что на предстоящем мероприятии, скорее всего, не будет представлен долгожданный преемник GPT-4 и GPT-4 Turbo, который предварительно будет называться GPT-5. По сообщениям The Information, мы можем ожидать, что выпуск GPT-5 произойдет ближе к концу 2024 года.

В понедельник, 13 мая, в 10:00 по тихоокеанскому времени (13:00 по восточному времени) OpenAI проведет презентацию. Это происходит за день до Google I/O, на котором Google, как ожидается, представит многочисленные инновации, связанные с искусственным интеллектом.

Смотрите также

2024-05-11 22:56