Ждете кокетливый голосовой режим ChatGPT? Ваше ожидание стало длиннее

Ждете кокетливый голосовой режим ChatGPT? Ваше ожидание стало длиннее

TLDR

  • Новый расширенный голосовой режим ChatGPT был отложен как минимум на один месяц.
  • OpenAI в настоящее время работает над повышением безопасности и надежности модели.
  • Эта функция скоро будет доступна избранным пользователям в виде ограниченной альфа-версии, а полный выпуск запланирован на конец 2024 года.

Как технический энтузиаст, внимательно следящий за развитием ChatGPT и OpenAI, я немного разочарован последней задержкой с внедрением расширенного голосового режима. Эта функция была долгожданной, и демо-версии, которые мы видели еще в мае, были действительно впечатляющими. Возможность вести естественно звучащие голосовые разговоры с чат-ботом, способным обнаруживать эмоции и сарказм и реагировать на них, меняет правила игры.


В прошлом месяце я обсуждал ожидаемый выпуск новаторской функции в приложении ChatGPT GPT-4: расширенный режим голосового разговора с возможностями, превосходящими возможности существующих личных помощников. К сожалению, OpenAI теперь сообщила, что эта функция еще не готова к использованию и, вероятно, пройдет как минимум еще месяц, прежде чем она станет доступной.

Как заядлый поклонник технологий, я в восторге от недавнего обновления OpenAI. Первоначально они намеревались выпустить новую функцию для избранной группы пользователей ближе к концу июня. Но после тщательного рассмотрения они решили отложить этот срок на месяц. По их собственным словам, они усердно работают над улучшением способности модели выявлять и отклонять нежелательный контент, уделяя приоритетное внимание безопасности.

OpenAI признала, что проблемы с инфраструктурой стали причиной задержки выпуска преемника ChatGPT. В этом нет ничего неожиданного, учитывая, что за последний месяц в ChatGPT неоднократно происходили сбои в работе. До этих сбоев я лично наблюдал снижение производительности и сбои при использовании стандартной функции голосового разговора. Будущая модель GPT-4 может потребовать больше вычислительных ресурсов, что еще больше усложнит задачу OpenAI по обеспечению почти мгновенного звукового ответа всего за 232 миллисекунды.

Как технический энтузиаст, я с нетерпением ждал новой функции OpenAI «Расширенный голос», которая, как они упомянули, станет доступна только в следующем месяце. Удивительно, но некоторые счастливчики, как сообщается, получили в приложении приглашение протестировать этот новый режим раньше, чем ожидалось. В приглашении оно описано как «ограниченная альфа-версия», но, как ни странно, его принятие не дает немедленного доступа к новой голосовой функции. Возможно, всплывающее окно появилось преждевременно.

В следующем месяце избранное число пользователей получит ранний доступ к альфа-версии OpenAI, а осенью ожидается более широкое внедрение. Тем не менее, OpenAI предупреждает, что эти графики могут измениться в зависимости от того, будет ли наша технология соответствовать строгим требованиям безопасности и надежности.

Что может расширенный голосовой режим ChatGPT?

Как исследователь, у меня была возможность стать свидетелем презентации новейшего голосового режима GPT-4 во время весеннего обновления OpenAI в мае. В последующие недели компания продемонстрировала коллекцию демонстраций, которые продемонстрировали, что ChatGPT выходит за рамки простого быстрого разговора. Теперь он мог имитировать сарказм, смех и другие интонации голоса. Более того, OpenAI утверждает, что эта модель будет способна распознавать эмоции в голосах пользователей и реагировать соответствующим образом — новаторское достижение для любого чат-бота.

Несколько демонстрационных видеороликов включали в себя как голосовые, так и визуальные функции GPT-4, что позволяло чат-боту отвечать на вопросы, касающиеся реальных сценариев. В одном показательном примере Сал Хан из Академии Хана продемонстрировал, как эту возможность можно использовать в качестве образовательного инструмента для решения математических задач на экране.

 

Как исследователь, изучающий последние разработки OpenAI, я наткнулся на несколько интересных новостей. OpenAI объявила в твиттере, что их новые функции видео и совместного использования экрана будут реализованы отдельно от голосового режима. Однако эти расширенные возможности будут доступны только тем, у кого есть обновленная подписка ChatGPT Plus. Ранее этот план стоимостью 20 долларов в месяц предоставлял пользователям текстовый доступ к модели GPT-40 и дополнительным функциям, таким как пользовательские GPT. Теперь, похоже, тех, кто решит обновиться, ждет еще больше преимуществ.

Смотрите также

2024-06-26 13:47