Пользователи говорят, что Gemini начинает забывать информацию задолго до того, как это должно произойти.

TLDR

Google заявляет, что Gemini в планах Pro и Ultra предлагает контекстное окно до одного миллиона токенов.
Однако, некоторые пользователи в сети жалуются, что чаты Gemini не поддерживают это контекстное окно.
Мы спросили Google, планирует ли она предоставлять более заметную информацию об окне контекста чата.

Google предлагает различные платные AI-подписки, которые дают вам больше доступа к Gemini, включая возможность использовать его чаще, использовать более мощные AI-модели и хранить больше данных в облаке. Эти Pro и Ultra планы также позволяют Gemini запоминать больше из вашего разговора – по сути, более длительную память. Однако некоторые пользователи заметили, что фактическая память Gemini кажется намного короче, чем то, что Google рекламирует.

"Просто покупай индекс", говорили они. "Это надежно". Здесь мы обсуждаем, почему это не всегда так, и как жить с вечно красным портфелем.

Поверить в рынок

Согласно Google, версии Pro и Ultra Gemini способны обрабатывать впечатляющий объем информации – до одного миллиона токенов. Это означает возможность работы с примерно 1500 страницами текста или 30 000 строками кода. Примеры можно найти на изображениях ниже.

Теперь пользователь X @Soso_fun_yt утверждает, что это окно контекста вводит в заблуждение пользователей чата:

В то время как бэкенд может успешно обрабатывать огромный статический файл при первом запросе, активная разговорная память (динамическое контекстное окно / KV-кэш для чата) кажется сильно ограничена, значительно снижаясь до лимита в 16k~. (Или 25-30 сообщений в среднем)

В результате, модель быстро страдает от амнезии в рамках той же сессии чата, полностью забывая более ранние инструкции, блоки кода или ограничения.

Хотя Gemini технически может обрабатывать до миллиона токенов информации одновременно, он не запоминает всё из одного разговора на протяжении такого длительного времени. Он начинает забывать то, что было сказано ранее, по мере продолжения разговора. Некоторые пользователи на Reddit упомянули об этом недавно, но отметили, что платформа AI Studio, казалось, справлялась с более длительными разговорами без проблем.

Как аналитик, я обеспокоен тем, что Google недостаточно откровенен. Они говорят о большом окне контекста для своей модели, но не объясняют чётко, какая часть этого фактически доступна во время типичного чата. Это похоже на интернет-провайдера, рекламирующего высокую скорость скачивания, не выделяя при этом гораздо более низкую скорость загрузки – технически это правда, но может ввести пользователей в заблуждение.

Google предоставляет информацию на своем сайте поддержки разработчиков о том, как работают токены – как для того, что вы вводите, так и для того, что генерируют модели. Они заявляют, что многие из их моделей обычно генерируют около 65 000 токенов. В настоящее время неизвестно, применяется ли это ограничение только к разработчикам, использующим модели напрямую, или также к обычным беседам с Gemini.

Мы связались с Google, чтобы прояснить разницу между объемом информации, которую ИИ может обработать в целом, и объемом информации, которую он запоминает в рамках одного разговора. Мы также поинтересовались, собираются ли они упростить понимание ограничений памяти разговора. Мы поделимся их ответом в нашей статье, как только получим его.

Смотрите также

2026-06-04 11:18