TLDR
- Microsoft разработала новый инструмент искусственного интеллекта под названием VASA-1, который может генерировать видео из одного изображения и аудиоклипа.
- Эта технология обладает невероятным потенциалом позитивного использования, но также несет в себе риск вредных манипуляций.
- Microsoft настаивает на том, что они подходят к VASA-1 с осторожностью, подчеркивая необходимость принятия надлежащих правил перед его обнародованием.
Новейшее достижение Microsoft в области генеративного искусственного интеллекта произвело значительный фурор в цифровом мире, раздвигая границы и вызывая у некоторых чувство беспокойства из-за его впечатляющего прогресса.
Используя VASA-1, модель преобразования изображения в видео, граница между подлинным и обработанным видео становится нечеткой. Объединив всего лишь одно изображение и аудиоклип, эта модель создает удивительно реалистичные кадры с убедительной синхронизацией губ и выражений лица.
Microsoft признает силу этой технологии, объясняя, что VASA-1 может создавать точную синхронизацию губ и улавливать широкий спектр эмоций, выражений лица и естественных движений головы, усиливая ощущение реальности и жизненной силы.
Эта система создает детализированные видеоролики с разрешением 512×512 пикселей и впечатляющей частотой кадров 45 кадров в секунду. Что еще более удивительно, так это то, что он генерирует реалистичное видео говорящей головы в реальном времени с частотой кадров 40 кадров в секунду.
Возможности невероятно интригующие. Визуализируйте образовательные ресурсы, в которых представлены исторически точные персонажи, оживающие, или виртуальные помощники, дающие советы и целительные преимущества. Тем не менее, риск неправомерного использования столь же значителен, что вызывает тревожные сигналы о создании глубоко убедительных дипфейков, которые могут распространять ложную информацию и подорвать доверие.
Microsoft понимает, что на данный момент для них это в основном исследовательский проект, как признается в их заявлении: «…как и в случае с другими методами создания контента, существует риск, что его можно использовать для обмана или причинения вреда людям. Мы категорически не одобряем использование такая технология для создания нечестных или вредных изображений реальных людей».
Это хорошая новость: Microsoft намерена отложить выпуск этой мощной технологии до тех пор, пока не будут приняты строгие правила. Этот подход удобен, и его следует чаще применять другим технологическим компаниям.
Смотрите также
- Обзор Fiio SR11: доступный сетевой стример с интеграцией Roon
- Аниме «Возможно, величайший алхимик всех времен» раскрывает превью новой серии 1 в преддверии январской премьеры
- Google до сих пор не исправил задержку уведомлений на пикселях, но вы можете попробовать это
- Какой цвет Galaxy S24 лучший? Мы проверили их все
- Беспроводные наушники Sony WH-1000XM6 планируют выпустить в 2025 году
- Лучшие фильмы десятилетия в формате Dolby Atmos (на данный момент) для проверки вашего домашнего кинотеатра
- OnePlus продолжает добавлять вредоносное ПО в OnePlus 12 и OnePlus Open, свои флагманы премиум-класса.
- Можно ли использовать поврежденное устройство Stellar Blade после «Неизвестного подарка»?
- 1Еще обзор SonoFlow Pro HQ51: бюджетные наушники стоят каждой копейки
- Первые 11 вещей, которые нужно сделать с Samsung Galaxy Watch Ultra
2024-04-18 21:27