Модель генерации видео VBench возглавляет чарты... Вершина чартов - WanX 2.1 скоро станет открытым исходным кодом!

Новости ИИОбновлено 6 месяцев назад Круг обмена ИИ
6.4K 00

Открытый исходный код на горизонте: создание видео с искусственным интеллектом для широких масс

Захватывающие новости! Компания AliCloud официально объявила о том, что ее долгожданная модель генерации видео с помощью искусственного интеллекта нового поколения, WanX 2.1, скоро станет открытой! 🎉 Эта модель, которую назвали "переосмыслением генерации видео", привлекла большое внимание в индустрии с момента ее выпуска. Теперь AliCloud решила открыть исходный код WanX 2.1, что, несомненно, придаст новый мощный импульс сфере создания видео с помощью искусственного интеллекта.

视频生成模型 VBench 排行榜前...榜首——WanX 2.1 即将开源!

WanX 2.1 - это последнее дополнение к мультимодальным макромоделям "Wanx" от AliCloud. В то время как "Tongyi Wanxiang" дебютировал в июле 2023 года, WanX 2.1 представляет собой последнее технологическое достижение в этой серии моделей. Она не только генерирует высококачественные изображения и видео на основе текстовых команд, но и является первой в мире моделью, поддерживающей текстовые эффекты на китайском и английском языках.

 

Превосходная производительность: лидер чартов VBench

WanX 2.1 потрясающе справляется с созданием фотореалистичного видео. Будь то работа со сложными сценами движения, оптимизация качества пикселей или точное понимание правил физики, WanX 2.1 демонстрирует выдающуюся производительность. В частности, благодаря точности понимания и выполнения пользовательских команд он выделяется в престижном списке моделей для генерации видео VBench с общим результатом 84,7%, лидируя в таких ключевых показателях, как динамика, пространственные отношения и взаимодействие между несколькими объектами.

На момент написания этой статьи первое место занял MiracleVision V5.

视频生成模型 VBench 排行榜前...榜首——WanX 2.1 即将开源!

Что делает WanX 2.1 таким выдающимся? Это невозможно отделить от постоянных инноваций и технологических прорывов, совершаемых исследовательской группой AliCloud.

 

Технологические инновации: создание более реалистичного видеомира

Стремясь к наивысшему качеству визуальной генерации, команда разработчиков WanX 2.1 исследовала и внедрила инновации в ряде ключевых технологических областей:

  • Самостоятельно разработанные рамки VAE и DiTВ WanX 2.1 используются собственные технологии Aliyun VAE (Variable Auto-Encoder) и DiT (Denoising Diffusion). Трансформатор), что значительно повышает способность модели понимать временные и пространственные соотношения видео. Это позволяет WanX 2.1 генерировать более реалистичный и естественный видеоконтент при работе со сценами, содержащими сложные правила движения и физики.
  • Механизмы всевременного внимания: Благодаря внедрению механизма Omni-temporal Attention, WanX 2.1 способен более точно улавливать и моделировать сложную и меняющуюся динамику реального мира, делая создаваемые видео более яркими и живыми.
  • Сверхдлинное контекстное обучение: Чтобы повысить способность модели понимать и выполнять текстовые команды, в WanX 2.1 также используется метод обучения со сверхдлинным контекстом, который ускоряет процесс обучения модели и обеспечивает бесшовную связь между текстовыми командами и созданием видеоконтента, делая создание видео более быстрым и интуитивным.
  • Первые двуязычные текстовые эффекты на английском и китайском языкахWanX 2.1 - первая в отрасли модель генерации видео, поддерживающая двуязычные текстовые эффекты, что значительно расширяет сценарии ее применения и позволяет лучше удовлетворять разнообразные творческие потребности индустрии рекламного дизайна и производства короткого видео.

 

视频生成模型 VBench 排行榜前...榜首——WanX 2.1 即将开源!

 

Текстовая подсказка: "Панорамный снимок фигуристки, выступающей на катке. Она одета в фиолетовый костюм и белые коньки и выполняет маневр с вращением. Ее руки широко расставлены, а тело отклонено назад, демонстрируя мастерство и грацию".

Благодаря этим инновациям WanX 2.1 с легкостью справляется с крупными движениями тела и сложными вращательными сценами. Даже в таких сложных сценариях, как фигурное катание, плавание и прыжки в воду, требующих высокого уровня траектории и координации тела, WanX 2.1 справляется с задачей, устанавливая новый стандарт качества для создания видео.

 

Совместное использование открытых источников: создание более широкой творческой экологии

В настоящее время WanX 2.1 доступен на официальном сайте Китая. полное представление обо всем Доступен бесплатный опыт. Индивидуальные разработчики и корпоративные пользователи могут первыми испытать возможности WanX 2.1 через платформу Aliyun Model Studio, раскрывая творческий потенциал и эффективно создавая высококачественный видеоконтент.

Открытый исходный код означает, что WanX 2.1 больше не будет ограничен конкретной платформой, а будет интегрирован в более широкую экосистему технологий ИИ. Этот шаг Aliyun, несомненно, будет способствовать росту популярности и развитию технологии создания видео с помощью ИИ, чтобы больше разработчиков и творческих людей могли встать на плечи гигантов и совместно исследовать безграничные возможности создания видео с помощью ИИ, а также по-настоящему реализовать глубокое слияние технологии ИИ и творческой индустрии. Давайте с нетерпением ждать того дня, когда WanX 2.1 получит открытый исходный код, и станем свидетелями наступления новой эры создания видео с помощью искусственного интеллекта!

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...