Функция Live Video в ChatGPT может постепенно расширяться

Функция Live Video в ChatGPT может постепенно расширяться

TLDR

  • OpenAI продемонстрировала возможности живого изображения в расширенном голосовом режиме в ChatGPT, но не поделилась графиком выпуска, кроме альфа-версии.
  • Мы обнаружили строки, которые предполагают, что функция, которую можно назвать «Живая камера», вскоре может быть выпущена в бета-версии ChatGPT.

Как опытный технологический аналитик с более чем двадцатилетним опытом работы, я был свидетелем эволюции ИИ от удаленного наблюдателя к активному участнику. Ожидание функции Live Camera в ChatGPT было ощутимым среди пользователей, и, похоже, мы наконец-то находимся на пороге ее выпуска.


Значительное количество людей ежедневно зависят от ChatGPT как в своих профессиональных, так и в личных задачах. OpenAI придал ChatGPT дружелюбность благодаря таким функциям, как расширенный голосовой режим, благодаря которым разговоры становятся более естественными. Однако пользователи с нетерпением ждали выхода ожидаемых возможностей машинного зрения. К счастью, похоже, что функции Live Video в расширенном голосовом режиме для ChatGPT вскоре могут стать доступными более широкому кругу пользователей.

В мае 2024 года OpenAI представила GPT-4o, подчеркнув, что расширенный голосовой режим ChatGPT вскоре будет включать сложные визуальные возможности в реальном времени. Примечательно, что они продемонстрировали эту новую функциональность, продемонстрировав, как обновленный расширенный голосовой режим может легко и плавно идентифицировать собаку в кадре камеры, вспомнить ее имя, различить мяч и связать собаку и мяч посредством действия, например, игры в мяч.

Демонстрация была весьма примечательной, учитывая минимальный объем данных, которые пользователи должны были предоставить напрямую, и скорость, с которой ИИ реагировал на поток с камеры в реальном времени. Было ощущение, будто пользователь разговаривал с человеком по видеосвязи.

Нескольким людям удалось протестировать функцию Live Video (зрение) на экспериментальной стадии, и все они ушли с одинаковым чувством трепета.

Пользователи проявили замечательное терпение, с нетерпением ожидая появления новой функции в приложении, но похоже, что OpenAI еще не указала конкретную дату выпуска возможностей машинного зрения в расширенном голосовом режиме после начальной альфа-фазы.

Похоже, что OpenAI готовится к выпуску бета-версии, поскольку мы нашли ссылки на его функции видения в расширенном голосовом режиме в самой последней бета-версии ChatGPT v1.2024.317.

Упомянутые термины предполагают, что во время бета-запуска эта функция может называться «Камера реального времени». Мы заметили рекомендации, напоминающие пользователям не использовать функцию камеры реального времени для навигации в реальном времени и принятия важных решений, влияющих на их здоровье и благополучие.

Поскольку строки были обнаружены в тестовой версии приложения, вполне вероятно, что компания готовится к более широкому выпуску бета-фазы, который может произойти в ближайшие недели. Предполагая, что это правда, мы предполагаем, что новая функция вскоре может быть доступна подписчикам ChatGPT Plus и, возможно, другим премиальным уровням AI-помощника.

Мы связались с OpenAI по поводу ожидаемой даты запуска функций зрения в реальном времени в расширенном голосовом режиме ChatGPT. Как только они ответят, мы обязательно обновим это сообщение их ответом.

Смотрите также

2024-11-18 15:47