Первый взгляд: Gemini Omni генерирует реалистичное AI-видео в новой утечке

TLDR

  • Пользователь Reddit получил ранний доступ к модели «Gemini Omni» в приложении Gemini, описываемой как новый инструмент Google для генерации AI-видео.
  • Ранние тесты демонстрируют впечатляющие навыки логического мышления в видео на математическую тематику, хотя более сложная сцена ужина выявила типичные для ИИ сбои, такие как появление объектов из ниоткуда.
  • Метаданные указывают на то, что модель является расширением Google «Veo», и пользовательские отчеты свидетельствуют о строгих ограничениях на использование в рамках плана Google AI Pro.

Google I/O 2026 на следующей неделе дает нам возможность заглянуть в будущее. Пользователи приложения Gemini заметили новую анимацию как на iPhone, так и на Android-телефонах. Но это не единственная новость – кто-то также обнаружил намеки на возможную новую AI-модель под названием «Gemini Omni», которая может быть последним достижением Google в создании видео с помощью AI.

"Просто покупай индекс", говорили они. "Это надежно". Здесь мы обсуждаем, почему это не всегда так, и как жить с вечно красным портфелем.

Поверить в рынок

Сегодня я смотрел приложение Gemini и заметил всплывающее сообщение. Оно приглашало меня «create with Gemini Omni», что, как я понимаю, является новым инструментом для создания видео от Google. Об этой новости я впервые узнал на 9to5Google.

Затем пользователь попытался сгенерировать видео со следующим запросом:

Профессор выводит математическое доказательство тригонометрических тождеств на традиционной школьной доске, объясняя шаг, который он в данный момент объясняет в уравнении.

Этот запрос дал им этот видеовыход с Gemini Omni:

https://youtube.com/watch?v=91S9TqOOHXo

Хотя и не безупречно, это видео впечатляет. Модель Omni успешно решила задачу и создала видео, которое выглядит очень реалистично и в основном точно. В нескольких местах можно понять, что оно сгенерировано ИИ – например, почерк не всегда соответствует написанному, а мел исчезает в конце – но в целом это хороший результат.

В рамках моего исследования я протестировал возможности ИИ по генерации видео, используя популярный запрос ‘Уилл Смит ест спагетти’ – распространенный эталон для этих моделей. Удивительно, но ИИ не сгенерировал видео по этому запросу, вероятно, из-за его фильтров безопасности. Поэтому я решил попробовать другой подход с новым запросом.

Можете ли вы создать сцену с двумя мужчинами за столом на берегу моря в престижном ресторане на открытой площадке. Они сидят за круглым столом с красивой белой скатертью и всеми изысканными аксессуарами, всеми ложками, вилками и ножами, изысканными салфетками, центральной композицией. Один мужчина – Уважаемый: зрелый афроамериканец в возрасте около 50 лет с короткой бородой и уверенной осанкой, одетый в сшитый на заказ, изысканный костюм, другой – его друг, оба приближаются к столу, чтобы съесть тарелку спагетти. В начале мужчины подходят к столу, обмениваются короткими любезностями и начинают спокойно есть спагетти, между укусами делясь беседой.

Вот вывод от Gemini Omni для этого запроса:

https://youtube.com/watch?v=Fn50buaHi1g

Это видео не такое уж и захватывающее. Спагетти, кажется, волшебным образом появляется на тарелках, и не похоже, что кто-то действительно наслаждается своей едой – мы не видим достаточно реального жевания.

Для сравнения, один пользователь Reddit по имени janekm3 протестировал тот же запрос с Seedance 2 (от ByteDance) и вот что он получил:

https://youtube.com/watch?v=q4P6Mm2Vo7Q

Вывод Seedance 2 выглядит более стабильным, хотя видео немного дрожит на моей стороне.

Пользователь Reddit по имени Zacatac_391 заметил новый раздел в своей учётной записи, показывающий, сколько у него осталось использования ИИ. Он сообщил, что после небольшого количества использования Flash и всего двух запросов на генерацию видео с его планом Google AI Pro он уже использовал 86% своего ежедневного лимита.

Макс Вайнбах обнаружил информацию в X, указывающую на то, что Omni построен на базе модели Veo. Нам придётся дождаться официального объявления Google, чтобы узнать больше деталей о Gemini Omni и о том, как она является усовершенствованием по сравнению с Veo.

Смотрите также

2026-05-12 10:48