Новый инструмент AI Video от Microsoft может стать следующей интернет-революцией или кошмаром

TLDR

Microsoft разработала новый инструмент искусственного интеллекта под названием VASA-1, который может генерировать видео из одного изображения и аудиоклипа.
Эта технология обладает невероятным потенциалом позитивного использования, но также несет в себе риск вредных манипуляций.
Microsoft настаивает на том, что они подходят к VASA-1 с осторожностью, подчеркивая необходимость принятия надлежащих правил перед его обнародованием.

Новейшее достижение Microsoft в области генеративного искусственного интеллекта произвело значительный фурор в цифровом мире, раздвигая границы и вызывая у некоторых чувство беспокойства из-за его впечатляющего прогресса.

"Просто покупай индекс", говорили они. "Это надежно". Здесь мы обсуждаем, почему это не всегда так, и как жить с вечно красным портфелем.

Поверить в рынок

Используя VASA-1, модель преобразования изображения в видео, граница между подлинным и обработанным видео становится нечеткой. Объединив всего лишь одно изображение и аудиоклип, эта модель создает удивительно реалистичные кадры с убедительной синхронизацией губ и выражений лица.

Microsoft признает силу этой технологии, объясняя, что VASA-1 может создавать точную синхронизацию губ и улавливать широкий спектр эмоций, выражений лица и естественных движений головы, усиливая ощущение реальности и жизненной силы.

Эта система создает детализированные видеоролики с разрешением 512×512 пикселей и впечатляющей частотой кадров 45 кадров в секунду. Что еще более удивительно, так это то, что он генерирует реалистичное видео говорящей головы в реальном времени с частотой кадров 40 кадров в секунду.

Возможности невероятно интригующие. Визуализируйте образовательные ресурсы, в которых представлены исторически точные персонажи, оживающие, или виртуальные помощники, дающие советы и целительные преимущества. Тем не менее, риск неправомерного использования столь же значителен, что вызывает тревожные сигналы о создании глубоко убедительных дипфейков, которые могут распространять ложную информацию и подорвать доверие.

Microsoft понимает, что на данный момент для них это в основном исследовательский проект, как признается в их заявлении: «…как и в случае с другими методами создания контента, существует риск, что его можно использовать для обмана или причинения вреда людям. Мы категорически не одобряем использование такая технология для создания нечестных или вредных изображений реальных людей».

Это хорошая новость: Microsoft намерена отложить выпуск этой мощной технологии до тех пор, пока не будут приняты строгие правила. Этот подход удобен, и его следует чаще применять другим технологическим компаниям.

Смотрите также

2024-04-18 21:27