У OpenAI теперь есть модель ИИ с видением, и всем остальным стоит бояться

У OpenAI теперь есть модель ИИ с видением, и всем остальным стоит бояться

  • За день до Google I/O 2024 OpenAI представила новую модель искусственного интеллекта, известную как GPT-4o.
  • Буква «o» в GPT-4o означает «omni», что указывает на возможности мультимодального взаимодействия модели.
  • GPT-4o, похоже, обеспечивает мультимодальную функциональность, основанную на зрении, рекламируемую такими компаниями, как Humane и Rabbit, практически на любом устройстве.
  • Последняя модель OpenAI потенциально может заменить несколько продуктов и услуг, от Humane AI Pin до Google Assistant и Duolingo.

В этой статье обсуждается последнее объявление OpenAI о GPT-4o и его последствия для технологической отрасли. Новая версия ChatGPT, основанная на GPT-4o, обладает впечатляющими мультимодальными возможностями с использованием голоса и видео, что заставляет Google продемонстрировать аналогичные функции на предстоящем мероприятии I/O. Демонстрации OpenAI показывают, что GPT-4o может превзойти нынешних помощников, таких как Google Assistant.


Эта неделя важна для искусственного интеллекта, поскольку OpenAI провела мероприятие 13 мая, а Google I/O 2024 запланирована на 14-15 мая. Вопреки слухам, OpenAI не представила конкурента в сфере поиска во время мероприятия, но представила GPT. -4° в понедельник. Эта новая модель искусственного интеллекта от OpenAI является мультимодальной и может обрабатывать различные входные данные, такие как изображение, текст и голос. Первоначальная реакция пользователей и исследователей после быстрых испытаний и демонстраций GPT-4o была положительной.

Уникальные возможности GPT-4o отличают его от предыдущих моделей искусственного интеллекта, что повышает вероятность замены существующих продуктов и услуг в различных областях. Поддержка мультимодального ввода для зрения, текста и голоса устраняет необходимость в аппаратных устройствах, таких как Humane AI Pin и Rabbit R1, что снижает их новизну. Кроме того, заявленное время отклика GPT-4o, соответствующее скорости человека при использовании голоса, может сделать Google Assistant устаревшим. Наконец, его расширенные функции перевода и обучения могут сделать такие приложения, как Duolingo, устаревшими.

Как технический энтузиаст, я с нетерпением жду реакции Google на OpenAI GPT-4 на их ежегодном мероприятии I/O в 2024 году. Кто знает, что у Google в рукаве? Возможно, они представят конкурентоспособное или даже лучшее предложение. Тем не менее, становится все более очевидным, что OpenAI устанавливает высокую планку для диалогового ИИ. До сих пор у ChatGPT и GPT-4 были некоторые заметные ограничения, из-за которых их было легче критиковать. Однако OpenAI постоянно решает эти проблемы, оставляя меньше возможностей для увольнения. Можно с уверенностью сказать, что другим технологическим компаниям следует начать относиться к OpenAI более серьезно.

Как аналитик мобильного ИИ, я могу сказать вам, что развитие технологии искусственного интеллекта (ИИ) для мобильных устройств развивается впечатляющими темпами. Вскоре функции, которые ранее были доступны только специализированному оборудованию и программному обеспечению, будут доступны прямо на вашем смартфоне. Это развитие имеет серьезные последствия для технологической отрасли, потенциально разрушая рынки, выходящие за рамки тех, на которых доминируют Humane AI Pin и Rabbit R1.

GPT-4o может конкурировать с Google Assistant, но у Google есть кое-что в рукаве

У OpenAI теперь есть модель ИИ с видением, и всем остальным стоит бояться

Google постепенно смещает акцент со своего собственного Google Assistant на более продвинутых голосовых помощников с искусственным интеллектом, таких как Gemini. Однако с появлением GPT-4o Google, возможно, будет трудно противостоять этому мощному интерфейсу искусственного интеллекта потребительского уровня. Обладая впечатляющими возможностями, такими как ответы на визуальные запросы о вашем окружении, создание звуковых ответов и обработка текстовых вводов, GPT-4o меняет правила игры в сфере ИИ-помощников.

С появлением GPT-4o от OpenAI кажется, что медленная реакция голосовых помощников ИИ ушла в прошлое. Сообщается, что модель способна давать ответы на голосовые запросы в среднем всего за 232 миллисекунды, а в некоторых случаях даже быстрее, что примерно эквивалентно времени, которое требуется человеку для формулирования ответа во время естественного разговора.

Приветствую! Рад представить вам нашу последнюю новинку: GPT-40, мою новую флагманскую модель. Эта передовая технология может одновременно обрабатывать и анализировать аудио, визуальные и текстовые данные в режиме реального времени. Начиная с сегодняшнего дня пользователи могут вводить текст и изображения через API и ChatGPT. В ближайшие недели мы также представим возможности голосовой и видеосвязи. Оставайтесь с нами, чтобы узнать больше! #ИИ #Инновации #Технологические достижения

See more

Как технический энтузиаст, я воодушевлен предстоящим выпуском GPT-4 в ChatGPT, но должен признать, что в ближайшее время мы не сможем испытать его голосовые и видеовозможности в действии. Тем не менее, демонстрации этой функции OpenAI произвели на меня глубокое впечатление, и если реальная производительность хотя бы приблизится к тому, что они показали, сегодня она может во многом затмить Google Assistant.

На момент написания этого текста Google анонсировал аналогичный мультимодальный инструмент искусственного интеллекта в рамках I/O 2024 во время записанного мероприятия. Однако истинные возможности инноваций Google остаются неопределенными до тех пор, пока не состоится прямая презентация.

До Google I/O остался всего один день! Мы едва можем сдержать волнение. Оставайтесь с нами завтра, чтобы получать свежую информацию об искусственном интеллекте, поиске и других инновациях. #GoogleIO #AnticipationBuilds pic.twitter.com/QiS1G8GBf9

See more

Несмотря на такое впечатление, OpenAI и ChatGPT, похоже, продвигаются вперед в области продвинутых языковых моделей: их мероприятие по GPT-4 запланировано всего за день до Google I/O 2024. Такое время было неслучайным. Следовательно, перед Google теперь стоит задача заставить пользователей предпочесть Gemini и Google Assistant ChatGPT.

OpenAI снова представляет специализированное оборудование для искусственного интеллекта

У OpenAI теперь есть модель ИИ с видением, и всем остальным стоит бояться

Конечно, достижения GPT-4 бросают вызов создателям специализированных аппаратных устройств искусственного интеллекта, таких как Rabbit R1 и Humane AI Pin. Благодаря ChatGPT пользователи в конечном итоге получат доступ к функциям, ранее эксклюзивным для этих гаджетов, таким как модель большого действия Rabbit (LAM), хотя и с некоторыми ограничениями. Пока Rabbit R1 не сможет эффективно использовать LAM для надежного и быстрого выполнения действий, актуальность устройства остается под вопросом. Вместо того, чтобы инвестировать в дорогостоящее оборудование и ежемесячную подписку на общую сумму 424 доллара, пользователи теперь могут бесплатно пользоваться аналогичными функциями на своих телефонах.

Как технический энтузиаст, я рад сообщить, что все внутренние и некоторые внешние выводы AI теперь работают на мощности GPT-4! Хотя это еще только начало, улучшения, которые мы наблюдаем, просто впечатляют. Задержка снизилась на 14 %, ответы стали в среднем на 28 % короче, а количество ошибочных ответов снизилось на 33 %. Сами по себе цифры не отражают общего чувства интеллекта и точности, которое пронизывает каждое взаимодействие. Впереди захватывающие времена! #AI #GPT4 #TechUpdate

See more

Руководитель отдела разработки продуктов Humane объявил в понедельник, что все их внутренние выводы AI используют GPT-40. Тем не менее, это открытие вызывает серьезные опасения. Если всю программную структуру для выводов AI можно было бы легко перевести на новую модель искусственного интеллекта в течение короткого периода времени, вполне вероятно, что эта структура во многом будет зависеть от технологии OpenAI. По сути, эти недавние события подтверждают утверждения о том, что AI Pin от Humane — это всего лишь «обертка» для ChatGPT от OpenAI.

Если есть возможность получить доступ к возможностям нового аппаратного продукта искусственного интеллекта на вашем смартфоне, почему бы вам не выбрать такое удобство? С другой стороны, если эти компании просто адаптируют модели OpenAI, не разумнее ли иметь дело напрямую с источником? Появление GPT-40 представляет еще большую угрозу для производителей оборудования для искусственного интеллекта, которые и без того испытывали трудности.

Никто не застрахован, пока OpenAI занимается разработкой ИИ

У OpenAI теперь есть модель ИИ с видением, и всем остальным стоит бояться

Влияние OpenAI неоспоримо, и ни одна компания не застрахована от его воздействия. Яркой иллюстрацией этого является Duolingo, акции которого значительно упали более чем на семь процентов после мероприятия OpenAI в понедельник. Причиной такой реакции рынка стало представление GPT-4o, усовершенствованной модели от OpenAI, обладающей замечательными способностями к переводу и обучению. Удивительно, но Duolingo, возможно, не первое имя, которое приходит на ум при рассмотрении конкурентов OpenAI; однако это объявление существенно повлияло на ее бизнес.

Способность OpenAI вытеснить любого конкурента подчеркивает тот факт, что ни один аппаратный или программный продукт не является неуязвимым для достижений в области искусственного интеллекта. Вероятность того, что Google Assistant последует этому примеру, вызывает беспокойство. Однако на I/O 2024 еще предстоит выяснить, почему Google продолжает оставаться грозным игроком в области искусственного интеллекта и с ним стоит считаться.

Смотрите также

2024-05-14 12:56