TLDR
- Новый расширенный голосовой режим ChatGPT был отложен как минимум на один месяц.
- OpenAI в настоящее время работает над повышением безопасности и надежности модели.
- Эта функция скоро будет доступна избранным пользователям в виде ограниченной альфа-версии, а полный выпуск запланирован на конец 2024 года.
Как технический энтузиаст, внимательно следящий за развитием ChatGPT и OpenAI, я немного разочарован последней задержкой с внедрением расширенного голосового режима. Эта функция была долгожданной, и демо-версии, которые мы видели еще в мае, были действительно впечатляющими. Возможность вести естественно звучащие голосовые разговоры с чат-ботом, способным обнаруживать эмоции и сарказм и реагировать на них, меняет правила игры.
В прошлом месяце я обсуждал ожидаемый выпуск новаторской функции в приложении ChatGPT GPT-4: расширенный режим голосового разговора с возможностями, превосходящими возможности существующих личных помощников. К сожалению, OpenAI теперь сообщила, что эта функция еще не готова к использованию и, вероятно, пройдет как минимум еще месяц, прежде чем она станет доступной.
Как заядлый поклонник технологий, я в восторге от недавнего обновления OpenAI. Первоначально они намеревались выпустить новую функцию для избранной группы пользователей ближе к концу июня. Но после тщательного рассмотрения они решили отложить этот срок на месяц. По их собственным словам, они усердно работают над улучшением способности модели выявлять и отклонять нежелательный контент, уделяя приоритетное внимание безопасности.
OpenAI признала, что проблемы с инфраструктурой стали причиной задержки выпуска преемника ChatGPT. В этом нет ничего неожиданного, учитывая, что за последний месяц в ChatGPT неоднократно происходили сбои в работе. До этих сбоев я лично наблюдал снижение производительности и сбои при использовании стандартной функции голосового разговора. Будущая модель GPT-4 может потребовать больше вычислительных ресурсов, что еще больше усложнит задачу OpenAI по обеспечению почти мгновенного звукового ответа всего за 232 миллисекунды.
Как технический энтузиаст, я с нетерпением ждал новой функции OpenAI «Расширенный голос», которая, как они упомянули, станет доступна только в следующем месяце. Удивительно, но некоторые счастливчики, как сообщается, получили в приложении приглашение протестировать этот новый режим раньше, чем ожидалось. В приглашении оно описано как «ограниченная альфа-версия», но, как ни странно, его принятие не дает немедленного доступа к новой голосовой функции. Возможно, всплывающее окно появилось преждевременно.
В следующем месяце избранное число пользователей получит ранний доступ к альфа-версии OpenAI, а осенью ожидается более широкое внедрение. Тем не менее, OpenAI предупреждает, что эти графики могут измениться в зависимости от того, будет ли наша технология соответствовать строгим требованиям безопасности и надежности.
Что может расширенный голосовой режим ChatGPT?
Как исследователь, у меня была возможность стать свидетелем презентации новейшего голосового режима GPT-4 во время весеннего обновления OpenAI в мае. В последующие недели компания продемонстрировала коллекцию демонстраций, которые продемонстрировали, что ChatGPT выходит за рамки простого быстрого разговора. Теперь он мог имитировать сарказм, смех и другие интонации голоса. Более того, OpenAI утверждает, что эта модель будет способна распознавать эмоции в голосах пользователей и реагировать соответствующим образом — новаторское достижение для любого чат-бота.
Несколько демонстрационных видеороликов включали в себя как голосовые, так и визуальные функции GPT-4, что позволяло чат-боту отвечать на вопросы, касающиеся реальных сценариев. В одном показательном примере Сал Хан из Академии Хана продемонстрировал, как эту возможность можно использовать в качестве образовательного инструмента для решения математических задач на экране.
Как исследователь, изучающий последние разработки OpenAI, я наткнулся на несколько интересных новостей. OpenAI объявила в твиттере, что их новые функции видео и совместного использования экрана будут реализованы отдельно от голосового режима. Однако эти расширенные возможности будут доступны только тем, у кого есть обновленная подписка ChatGPT Plus. Ранее этот план стоимостью 20 долларов в месяц предоставлял пользователям текстовый доступ к модели GPT-40 и дополнительным функциям, таким как пользовательские GPT. Теперь, похоже, тех, кто решит обновиться, ждет еще больше преимуществ.
Смотрите также
- Samsung TV Plus не работает? Вот как это исправить
- 10 творческих применений Bluetooth-трекера
- Поклонники Marvel убеждены, что Ванда возвращается после одной строчки в шестом эпизоде «Агата всегда»
- Я ходил на ужин под музыку Bang & Olufsen – и это было очень странно.
- Google не хочет, чтобы Play Store открывался, и ищет экстренную приостановку
- Дженна Ортега может присоединиться к кинематографической вселенной Marvel
- Шокирующая история инсульта Обри Плазы: как случай, изменивший ее жизнь, изменил ее взгляд на жизнь
- Ключи доступа усложняют переход на Android, но ненадолго
- Я заменил Panasonic OLED на Samsung QD-OLED, и мне очень не хватает этой особенности.
- «Чудеса: Сказки о божьей коровке и Коте Нуаре» получили аниме-версию
2024-06-26 13:47