Наконец-то появился режим голосового чата Gemini, а также преимущества экосистемы Pixel.

Наконец-то появился режим голосового чата Gemini, а также преимущества экосистемы Pixel.

TLDR

  • Google наконец-то выпустила Gemini Live, долгожданную функцию, которая обеспечивает естественное голосовое общение с чат-ботом с искусственным интеллектом.
  • Pixel Buds Pro 2 позволит вам вызвать Gemini Live с помощью пробуждающего слова «Эй, Google».
  • Gemini Live будет доступен подписчикам Gemini Advanced при запуске.

Как опытный энтузиаст технологий, питающий слабость к инновационным приложениям искусственного интеллекта, я должен сказать, что Gemini Live от Google — это глоток свежего воздуха в мире цифровых помощников. Будучи одним из первых, кто внедрил ChatGPT и его голосовой режим, я могу подтвердить преобразующий потенциал такого диалогового ИИ, работающего в режиме реального времени. Тем не менее, что отличает Gemini Live для меня, так это возможность прерывать ответ в середине ответа, что действительно создает ощущение естественного разговора без сценария.


Приложение Google Gemini теперь включает долгожданную функцию голосового взаимодействия в реальном времени, как ранее намекала компания в этом году. Названный Gemini Live, он имеет некоторое сходство с голосовой опцией ChatGPT, которая доступна с прошлого года. Оба позволяют проводить расширенные интерактивные дискуссии по широкому кругу тем и являются значительным шагом вперед по сравнению с предыдущими цифровыми помощниками. Тем не менее, что отличает Gemini Live, так это возможность прерывания во время ответа, что способствует более плавному общению. В отличие от традиционных чат-ботов, вам не нужно ждать, пока бот завершит ответ, или коснуться экрана, чтобы прервать его или переключить тему.

Функция Gemini Live предоставляет выбор из десяти различных вариантов голоса, которые в настоящее время доступны только опытным пользователям Gemini.

В качестве подсластителя Google предоставляет годовую подписку на свой сервис Google One Premium AI, если вы покупаете модели Pixel 9 Pro, Pixel 9 Pro XL или Pixel 9 Pro Fold, представленные сегодня. Обычно эта услуга стоит 20 долларов в месяц, но она включает в себя 2 ТБ облачного хранилища и другие стандартные преимущества от Google One, а также Gemini Advanced.

В декабре прошлого года Google представила свою модель искусственного интеллекта Gemini и показала видео, в котором чат-бот ведет голосовые разговоры и интерпретирует визуальные сигналы через веб-камеру в режиме реального времени. Однако позже выяснилось, что демонстрация была частично постановочной: модели Gemini предоставлялись текстовые подсказки вместо голосового ввода в реальном времени и прямой трансляции презентации. Перенесемся в сегодняшний день: версия искусственного интеллекта Gemini Live наконец-то достигла первоначальной цели Google — обеспечить подлинные голосовые разговоры в реальном времени.

Вы можете прервать Gemini Live одним голосом и вести естественный разговор без помощи рук.

Примечательно, что новейшие Pixel Buds Pro 2 предлагают более обширную интеграцию с Gemini Live. Благодаря этому обновлению вы теперь можете активировать сеанс Gemini Live, просто сказав «Эй, Google» в наушниках, даже если ваш телефон заблокирован и находится в кармане. Это улучшение представляет собой значительное улучшение по сравнению с текущим поведением помощника, в котором Gemini отвечает только на одну команду после вызова с помощью слова пробуждения.

Совет Google предлагает более плавное взаимодействие с устройствами Pixel, обеспечивающее полную свободу рук. Это означает, что с грядущим Pixel Buds Pro 2, если вы используете смартфон Pixel, вы сможете с самого начала наслаждаться работой без помощи рук без необходимости вручную инициировать сеанс Gemini Live. На других устройствах вам может потребоваться сначала разблокировать телефон перед началом сеанса Gemini Live.

Как человек, который уже несколько лет использует различные модели искусственного интеллекта, я могу с уверенностью сказать, что мне очень приятно видеть достижения OpenAI в ChatGPT. Предстоящий «расширенный» голосовой режим, похоже, может значительно улучшить мои навыки общения, особенно если он сможет воспроизвести естественное взаимодействие Gemini Live. Однако, как человека, который ценит доступность и равноправные технологии, меня немного разочаровывает тот факт, что эта функция будет доступна исключительно подписчикам ChatGPT Plus. Хотя я понимаю необходимость монетизации подобных бизнес-моделей, я надеюсь, что OpenAI рассмотрит возможность сделать такие премиальные функции более доступными в будущем. В конце концов, ИИ может принести большую пользу людям из разных слоев общества, и важно обеспечить доступ к его преимуществам каждому, а не только тем, кто может позволить себе подписку.

Смотрите также

2024-08-13 20:52