TLDR
- Китайская компания DeepSeek выпустила свои модели изображений Janus Pro.
- Компания утверждает, что эти модели могут конкурировать или превосходить Stable Diffusion и DALL-E 3 в тестах.
- Онлайн-демонстрация не дает отличных результатов, но неясно, является ли она репрезентативной для окончательной модели.
Как исследователь, я рад поделиться своими выводами о DeepSeek, китайской технологической фирме, которая недавно представила свою модель DeepSeek R1 AI. Этот новичок в этой области сумел конкурировать с такими известными игроками, как OpenAI, предоставляя сопоставимые результаты, используя значительно меньше ресурсов для обучения и более старое оборудование AI. Теперь DeepSeek обновила свою модель обработки изображений, которая, похоже, бросает вызов гигантам в этой отрасли.
DeepSeek запустила свою серию моделей изображений Janus Pro на GitHub и Hugging Face, и она доступна как в моделях с одним миллиардом, так и с семью миллиардами параметров. Интересно, что компания утверждает, что последняя модель может конкурировать или превосходить Stable Diffusion и DALL-E 3 в тестах производительности. Стоит отметить, что это всего лишь несколько тестов производительности, в то время как это сравнение проводилось со старыми версиями Stable Diffusion. Но это все равно довольно впечатляющее достижение, если подтвердится.
Важно отметить, что при загрузке изображения на Janus Pro максимальный размер составляет 384 x 384 пикселей. Однако неясно, какой размер будут у выходных изображений. С другой стороны, изображения, созданные с помощью демо HuggingFace, имеют размер 768 x 768 пикселей. Поэтому мы ожидаем, что DeepSeek устранит это ограничение ввода в ближайшие дни.
Несмотря на это, компания продемонстрировала серию фотографий, подчеркивающих существенные различия между оригинальной моделью Janus и моделью Janus Pro 7B, что предполагает существенное обновление. Посмотрите на них ниже.
Демонстрацию модели Janus Pro 7B можно найти на HuggingFace, но должен признать, что она не оправдала моих ожиданий. Взгляните на изображение, созданное демонстрацией (слева), и сравните его с изображением Microsoft Copilot, созданным с помощью DALL-E 3, когда обеим командам было предложено изобразить гоночный автомобиль F1 по Монако. Мы запросили у команды DeepSeek, является ли эта демонстрация показательной для окончательной модели. Имейте в виду, что ваше удовлетворение может отличаться.
Тем не менее, выпуск Janus Pro состоялся вскоре после того, как AI Assistant от DeepSeek стал самым популярным бесплатным приложением в Apple App Store. Android Authority участник Дхрув Бхутани лично поработал с новым приложением и обнаружил, что оно выдает более качественный результат, чем ChatGPT. Он также похвалил в основном бесплатную природу платформы и возможность запускать ее локально.
Смотрите также
- Обзор Fiio SR11: доступный сетевой стример с интеграцией Roon
- Лучшие телефоны для людей, чувствительных к ШИМ/мерцанию, 2024 г.
- Какой цвет Galaxy S24 лучший? Мы проверили их все
- Google до сих пор не исправил задержку уведомлений на пикселях, но вы можете попробовать это
- Лучшие фильмы десятилетия в формате Dolby Atmos (на данный момент) для проверки вашего домашнего кинотеатра
- Обзор умных очков RayNeo Air 2S XR: повышение уровня
- Какой цвет Samsung Galaxy S25 Ultra выбрать?
- 30 лучших фильмов об обмене парой и женой, которые вам нужно посмотреть
- Подходят ли чехлы для Samsung Galaxy Z Flip 5 к Samsung Galaxy Z Flip 6?
- У Google есть новая игра-дудл, в которой вы против Луны
2025-01-28 09:47