Gemini становится ещё лучше в обработке естественных разговоров.

TLDR

  • Google выпускает обновление Gemini 2.5 Flash Native Audio для агентов голосового сопровождения в реальном времени.
  • С этим обновлением модель будет лучше справляться со сложными рабочими процессами, понимать инструкции пользователей и поддерживать естественные разговоры.
  • Это обновление начало распространяться для Gemini Live, Search Live, Google AI Studio и Vertex AI.

Новый ИИ от Google, Gemini, делает общение с виртуальными помощниками более реалистичным и естественным по сравнению со старыми версиями, такими как Google Assistant. Хотя Gemini уже является улучшением, Google продолжает совершенствовать его с помощью новых обновлений, разработанных для того, чтобы сделать общение еще лучше.

"Просто покупай индекс", говорили они. "Это надежно". Здесь мы обсуждаем, почему это не всегда так, и как жить с вечно красным портфелем.

Поверить в рынок

Google только что объявила об обновлении Gemini 2.5 Flash, специально для голосовых приложений, которым необходимо отвечать в режиме реального времени. Обновление сосредоточено вокруг трех основных улучшений.

  • Более точный вызов функций: Повышена надёжность при вызове внешних функций. Gemini теперь может точнее определять, когда необходимо собирать информацию в реальном времени во время разговора. Затем он может бесшовно включить эти данные в свой аудиоответ, не прерывая ход беседы.
  • Следование инструкциям: Модель теперь выполняет 90% инструкций разработчиков, что является улучшением по сравнению с предыдущими 84%. В результате она может лучше справляться со сложными инструкциями и предоставлять более надежные результаты.
  • Более плавные разговоры: Gemini 2.5 Flash Native Audio теперь может более эффективно извлекать контекст из предыдущих моментов в разговоре, обеспечивая более связные беседы.

Джош Вудворд, вице-президент Google, курирующий Gemini и AI Studio, также объявил о двух новых функциях для Gemini Live. Теперь инструмент не будет прерывать вас, если вы сделаете паузу во время речи, и вы можете отключить микрофон, пока он говорит, чтобы случайно его не отключить.

Я заметил, что Google только что выпустил обновление, предназначенное для улучшения того, как их AI-модель справляется со сложными задачами, понимает, что я прошу её сделать, и в целом делает разговоры более естественными. Оно уже начинает появляться в таких продуктах, как Gemini Live, Search Live, Google AI Studio и Vertex AI. И это было не всё – они также поделились некоторыми предстоящими изменениями для приложения Translate.

Смотрите также

2025-12-13 00:18