GPT-5 против Gemini 2.5 Pro: смелый шаг OpenAI в развивающемся ландшафте искусственного интеллекта

В плане развития искусственного интеллекта OpenAI имеет значительное преимущество перед своими конкурентами, преимущество, которое другим может быть трудно повторить. Между тем, ChatGPT может похвастаться большим количеством еженедельных пользователей, чем Meta или Google за месяц, что иллюстрирует преимущества, которые дает раннее лидерство. Очевидно, что OpenAI извлекает выгоду из этого раннего старта.

"Просто покупай индекс", говорили они. "Это надежно". Здесь мы обсуждаем, почему это не всегда так, и как жить с вечно красным портфелем.

Поверить в рынок

Несмотря на первоначальный отрыв, похоже, что другие системы искусственного интеллекта, такие как Google, DeepSeek, Claude и xAI, сократили разрыв — особенно в плане производительности. Эти модели неизменно входят в пятерку лучших в таблице лидеров LMArena, что говорит о том, что путь от базовых больших языковых моделей (LLM) к общему искусственному интеллекту (AGI) еще не определен. Долгое время я верил, что Gemini 2.5 Pro превосходит и предлагает большую универсальность с точки зрения мыслительных способностей по сравнению с предложениями OpenAI.

Компания OpenAI недавно сделала свою GPT-5 доступной для всех пользователей (по состоянию на 7 августа). По сути, это комбинация моделей, которая выборочно выбирает оптимальную для конкретного запроса в реальном времени. В настоящее время она лидирует в рейтингах LMArena и WebDev Arena — это важные показатели производительности языковых моделей.

GPT-5 не полностью решает проблему галлюцинаций ChatGPT и не является общим искусственным интеллектом. В некоторых аспектах модели Google все еще превосходят аналогичные от OpenAI. Однако, несмотря на эти различия, GPT-5 примечателен своей бесплатностью и мощностью, чего может быть достаточно OpenAI, чтобы сохранить свое значительное преимущество над конкурентами.

Где GPT-5 от OpenAI превосходит Gemini 2.5 Pro от Google

Отличительной особенностью GPT-5 является не вычислительная мощность и не база знаний. Ключевым аспектом является маршрутизация в реальном времени, которая интеллектуально выбирает подходящую модель для вашей задачи, не требуя дополнительного ввода от вас. В настоящее время ИИ-чат-боты, такие как ChatGPT и Gemini, содержат смесь старых, новых и экспериментальных моделей, каждая из которых предназначена для решения конкретных запросов. Хотя это разнообразие полезно, выбор оптимальной модели часто остаётся за пользователем. С такими названиями, как GPT-o3, GPT-4o или Gemini Flash Thinking Experimental, принятие этого решения иногда могло быть сложным.

Вместо того, чтобы быть одной моделью, GPT-5 на самом деле представляет собой объединение моделей OpenAI. Существует менее сложная модель для простых, быстрых запросов, и более продуманная, под названием GPT-5 Thinking, для сложных вопросов. На практике эти модели функционируют как единое целое для пользователя благодаря системе маршрутизации OpenAI в реальном времени. Когда вы вводите запрос в ChatGPT, этот маршрутизатор направляет его к соответствующей модели, тем самым улучшая пользовательский опыт.

Существуют способы вручную указать, какая модель GPT-5 отвечает на ваш запрос. Вы можете включить в свой вопрос фразы вроде

Онлайн-ресурсы, такие как TopMob, играют значительную роль в снижении галлюцинаций в GPT-5, по словам OpenAI. Интегрируя веб-поиск в запросы GPT-5, модель примерно на 45% менее склонна к фактическим ошибкам по сравнению со своей предыдущей версией, GPT-4o. Галлюцинации не устранены полностью, но их частота значительно снижается при использовании GPT-5 в ChatGPT.

На основе различных независимых тестов и сравнений, утверждения OpenAI о том, что GPT-5 превосходит Gemini 2.5 Pro, подтверждаются. GPT-5 удалось превзойти Gemini 2.5 Pro в таблицах лидеров LMArena и WebDev Arena, заняв первое место в целом. Особенно заметно его превосходство в текстовых и кодировочных задачах. Я попробовал кодировочный запрос от OpenAI на ChatGPT (который работает на GPT-5) и был искренне впечатлен результатами.

Где Gemini все еще превосходит ChatGPT

Как исследователь, я обнаружил, что GPT-5 не превосходит Gemini 2.5 Pro по всем параметрам, и похоже, OpenAI ещё предстоит достичь паритета с возможностями Google в области генерации изображений и видео. Это различие очевидно в тестах LMArena по преобразованию текста в изображение, текста в видео и изображения в видео, где инструменты Google Imagen 4 и Veo 3 постоянно демонстрировали превосходные результаты во всех тестах генеративного графического искусственного интеллекта.

Создайте изображение, на котором Джонни Тандерберд поднимает трофей турнира Big East в Мэдисон-сквер-гарден. Вот ссылка на изображения: https://example.com/images/chatgpt_gemini_comparison

Проще говоря, изображения, созданные Google, лучше соответствуют эталонным показателям производительности по сравнению с теми, которые созданы OpenAI. Чтобы проиллюстрировать это, когда я запросил сгенерированное изображение у Google, оно было готово примерно за 10 секунд. С другой стороны, создание изображения с помощью ChatGPT заняло почти две минуты.

По точности Gemini явно превзошло. Оно точно определило баскетбольную программу моего альма-матер по ссылке на талисман и создало детализированное и стильное изображение Мэдисон-сквер-гарден. С другой стороны, ChatGPT создало изображение с неправильной командой, и хотя это может быть баскетбольная площадка, я не уверен, что это Мэдисон-сквер-гарден; похоже, что это любая стандартная баскетбольная площадка.

Если вам нравится использовать различные большие языковые модели (LLM) в зависимости от ваших задач, рассмотрите возможность выбора GPT-5 для написания или программирования, а Gemini – для создания изображений или видео.

GPT-5 отличный, но GPT-4o никак не собирается уходить

Неожиданная проблема с выпуском GPT-5 от OpenAI заключается в том, что пользователи продолжают использовать старые модели. Разработанная на протяжении двух лет, OpenAI стремилась создать модель искусственного интеллекта, достойную этого имени, но, похоже, пользователи с этим не согласились. В результате OpenAI решила перезапустить GPT-4o — модель, которая ранее планировалась к выводу из эксплуатации в пользу GPT-5 — из-за сопротивления пользователей (сообщает Tom’s Guide). В этом перефразировании я стремился сохранить исходное значение, используя более простой язык и делая его более привлекательным для читателей.

Для многих, кто напрямую общается с реальными людьми, это может показаться несколько необычным, но пользователи ChatGPT часто формируют чувство личной связи с моделями OpenAI. Они, как правило, предпочитают использовать ту модель ИИ, с которой они знакомы, даже если GPT-5 предлагает превосходную производительность в целом.

Вероятно, эту концепцию можно расширить, чтобы охватить более широкое соревнование в области ИИ. Другими словами, не имеет существенного значения, какая компания — Google, OpenAI, Claude или DeepSeek — имеет наиболее эффективную модель. Люди склонны отдавать предпочтение и придерживаться моделей, к которым они привыкли, что означает, что преимущество OpenAI в этой области другим может быть трудно преодолеть из-за лояльности к бренду.

Смотрите также

2025-08-12 02:24