Нативная аудиомодель Gemini Live помогает ей говорить более естественно, как человек.

TLDR

  • Google представила обновления модели Gemini Live на мероприятии, посвященном запуску Google Pixel 10, и теперь они широко распространяются среди пользователей iOS и Android.
  • Gemini Live теперь, вероятно, работает на Gemini 2.5 Flash Live API с нативной поддержкой аудио, что обеспечивает более «адаптивные и выразительные» чаты.
  • Пользователи могут персонализировать речь Gemini Live, чтобы она соответствовала их предпочтениям, изменяя аспекты её подачи, такие как скорость, тон и акценты.

Gemini Live, AI-ассистент от Google, получает обновление, чтобы звучать более естественно и непринужденно. Google впервые продемонстрировала эту улучшенную функцию, называемую native audio output, на запуске Pixel 10. Теперь каждый, кто использует Gemini Live, может получить к ней доступ после небольшого тестирования, которое началось в октябре.

"Просто покупай индекс", говорили они. "Это надежно". Здесь мы обсуждаем, почему это не всегда так, и как жить с вечно красным портфелем.

Поверить в рынок

Google сообщает, что последние обновления значительно улучшили способность Gemini Live понимать, как говорят люди. Согласно их объявлению, это приводит к более естественным и увлекательным беседам. Теперь пользователи Gemini Live могут легко настраивать ответы ассистента – например, они могут попросить его говорить быстрее, медленнее или с другим тоном или акцентом.

Gemini Live получает обновление благодаря улучшениям в модели искусственного интеллекта, которая его обеспечивает. Хотя Google официально и не назвал новую модель, скорее всего, это Gemini 2.5 Flash Live API, который стал доступен для тестирования в сентябре 2025 года. Google утверждает, что это обновление сделает разговоры гораздо более естественными, как будто вы разговариваете с реальным человеком – и именно этого стремится добиться новый опыт Gemini Live.

https://youtube.com/watch?v=ALUhQFUeO8U

Недавно Google выделил, как люди могут настраивать свои чаты с Gemini Live. Одна из функций позволяет изменить скорость ответа Gemini, что может быть полезно для доступности. Например, студент использовал это, чтобы попросить Gemini говорить быстрее, чтобы получить ответ до начала занятий.

Gemini Live превосходно понимает естественный язык, что делает его отличным инструментом для обучения. Помимо этого, вы можете использовать его для практики разговорной речи – будь то изучение нового языка, подготовка к собеседованию или просто желание улучшить свои навыки публичных выступлений. Он может даже рассказывать истории, используя различные голоса или акценты персонажей для развлечения.

Настроенная сессия Gemini Live продолжается, пока вы её не завершите. Если вы начнёте новый разговор, всё сбросится к исходным настройкам, позволяя вам настроить её снова с нуля.

Обновления модели Gemini Live доступны сейчас в приложении Gemini для iOS и Android.

Смотрите также

2025-11-12 23:18