Wan2.2-Animate - 通义万相开源的动作生成模型

堆友AI

Wan2.2-Animate是什么

Wan2.2-Animate是通义万相开源的动作生成模型,支持动作模仿和角色扮演两种模式。用户只需输入一张角色图片和一段参考视频,模型能将视频中角色的动作、表情迁移到图片角色中,赋予图片角色动态表现力。能在保留原始视频的动作、表情及环境的基础上,将视频中的角色替换为图片中的角色。模型支持驱动人物、动漫形象和动物照片,可应用于短视频创作、舞蹈模板生成、动漫制作等领域。构建了涵盖说话、面部表情和身体动作的大规模人物视频数据集,基于通义万相图生视频模型进行后训练,实现了单一模型同时兼容两种推理模式。针对身体运动和脸部表情分别使用骨骼信号和隐式特征,配合动作重定向模块,实现动作和表情的精准复刻。

Wan2.2-Animate - 通义万相开源的动作生成模型

Wan2.2-Animate的功能特色

  • 动作与表情迁移:输入角色图片和参考视频,可将视频角色的动作、表情迁移到图片角色中,赋予图片角色动态表现力。
  • 角色替换:在保留原始视频的动作、表情及环境的基础上,将视频中的角色替换为图片中的角色。
  • 多角色类型支持:可驱动人物、动漫形象和动物照片,应用范围广泛。
  • 大规模数据集构建:涵盖说话、面部表情和身体动作的大规模人物视频数据集,提升模型性能。
  • 统一表示格式:将角色信息、环境信息和动作等规范到统一的表示格式,实现单一模型兼容两种推理模式。
  • 精准复刻:针对身体运动和脸部表情,分别使用骨骼信号和隐式特征,配合动作重定向模块,实现动作和表情的精准复刻。
  • 光照融合效果:在替换模式中,设计独立的光照融合LoRA,保证完美的光照融合效果。

Wan2.2-Animate的核心优势

  • 高效动作迁移:能精准地将参考视频中的动作和表情迁移到目标角色图片上,迁移效果自然流畅,赋予静态角色生动的动态表现力。
  • 环境融合自然:在角色替换时,可完美保留原始视频的动作、表情及环境信息,实现角色与背景的自然融合,避免出现不自然的违和感。
  • 多角色类型适配:支持人物、动漫形象和动物等多种角色类型,具有广泛的适用性,可满足不同领域的创作需求。
  • 大规模数据集支撑:基于涵盖说话、面部表情和身体动作的大规模人物视频数据集进行训练,数据丰富多样,使模型具备更强的学习能力和泛化能力。
  • 单一模型多模式:将角色信息、环境信息和动作等规范到统一的表示格式,实现单一模型同时兼容动作模仿和角色扮演两种推理模式,降低模型使用成本。
  • 精准复刻技术:针对身体运动和脸部表情,分别使用骨骼信号和隐式特征,配合动作重定向模块,能够精准复刻动作和表情,提高生成视频的质量和真实感。
  • 光照融合优化:在替换模式中设计了独立的光照融合LoRA,有效保证了光照的一致性和融合效果,使生成视频在视觉上更加自然协调。

Wan2.2-Animate官网是什么

  • 项目官网:https://humanaigc.github.io/wan-animate/
  • Github仓库:https://github.com/Wan-Video/Wan2.2
  • HuggingFace模型库:https://huggingface.co/Wan-AI/Wan2.2-Animate-14B

Wan2.2-Animate的适用人群

  • 内容创作者:可用于快速生成创意视频,如动画、广告、短视频等,提升创作效率和内容多样性。
  • 动画制作人员:可将静态角色赋予动态效果,简化动画制作流程,降低制作成本,提升动画质量。
  • 舞蹈爱好者和创作者:能够生成个性化的舞蹈模板,帮助创作独特的舞蹈视频内容。
  • 动漫爱好者:可将喜欢的动漫角色进行动态化创作,满足个性化需求,提升创作乐趣。
  • 教育工作者:可用于制作教学视频,如展示复杂的运动过程,提升教学效果和趣味性。
  • 广告与营销人员:能够快速生成吸引人的广告视频,提升广告的创意和吸引力。
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...