Последняя попытка Google исправить квоты на токены здесь: знакомьтесь с Gemini 3.5 Flash Low.

TLDR

  • Google представила Gemini 3.5 Flash (Low) для оптимизации использования токенов для простых задач, после жалоб пользователей на жесткие ограничения в Antigravity.
  • Новая Low-вариация генерирует примерно на 45% меньше токенов, чем исходная модель, которая, по-видимому, была переименована в Gemini 3.5 Flash (Medium).
  • Вместе с новой моделью, Google обновил квоту Gemini во всех платных и бесплатных планах, чтобы помочь пользователям с задачами по разработке программного обеспечения.

Недавно выпущенная модель Gemini 3.5 Flash от Google была хорошо принята, но сопутствующий план AI Pro изначально имел ограничения, которые раздражали пользователей, особенно тех, кто использовал его для кодирования с Antigravity. Google отреагировала, значительно увеличив лимиты использования Antigravity, но пользователи все равно находили их ограничивающими. Теперь Google запустила новую модель Gemini, которая еще более эффективна, используя меньше вычислительных блоков, чем Gemini 3.5 Flash.

"Просто покупай индекс", говорили они. "Это надежно". Здесь мы обсуждаем, почему это не всегда так, и как жить с вечно красным портфелем.

Поверить в рынок

Варун Мохан, директор в Google DeepMind, работающий над проектом Antigravity, заметил, что пользователи обеспокоены тем, что модель использует слишком много процессорных токенов для простых запросов. Чтобы решить эту проблему, Google выпустила Gemini 3.5 Flash (Low), которая разработана для более эффективного использования токенов для этих более простых задач.

Google обновила свою модель Gemini 3.5 Flash. Оригинальная версия теперь называется Gemini 3.5 Flash (Medium), и была выпущена новая, более эффективная версия ‘Low’, которая производит примерно на 45% меньше токенов. Google также заявляет, что версия ‘Low’ обычно работает лучше, чем предыдущая модель Gemini 3 Flash – теперь именуемая как вариант ‘High’ – когда речь идет о задачах, связанных с разработкой программного обеспечения (SWE).

Google также обновил лимиты использования для Gemini, как для бесплатных, так и для платных планов. Это гарантирует, что у каждого будет достаточно ресурсов для продолжения своих проектов в области разработки программного обеспечения на этой неделе.

Один пользователь отметил, что кажется, будто Google использует своих клиентов в качестве подопытных, задаваясь вопросом, проводилось ли какое-либо тестирование перед запуском. Представитель Google, г-н Мохан, понял эту обеспокоенность, объяснив, что команда некоторое время тестировала модель самостоятельно. Хотя Google сделала Gemini 3.5 Flash быстрой и эффективной в решении сложных задач, они упустили из виду точное отслеживание использования токенов для более простых.

Г-н Мохан обещает улучшения в будущем.

По словам Мохана, обновления для Gemini 3.5 Flash (Low) сосредоточены на том, сколько усилий модель прилагает к каждому ответу, не упрощая инструкции и не сокращая входные данные, которые она рассматривает.

Новая версия лучше всего подходит для быстрых и простых задач. Для более сложных задач, пожалуйста, используйте более детальную опцию.

Эти ответы были сгенерированы с использованием Antigravity, платформы Google для разработки программного обеспечения на основе искусственного интеллекта. Я не смог найти Gemini 3.5 Flash (Low) как отдельную модель в стандартном приложении Gemini, и, вероятно, она не будет добавлена. Однако, я не испытывал замедлений даже при интенсивном использовании, поэтому проблема может быть специфична для самого Antigravity.

Смотрите также

2026-05-25 16:49