HappyHorse-1.0 - 阿里ATH创新事业部开源的AI视频生成模型

堆友AI

HappyHorse-1.0是什么

HappyHorse-1.0(欢乐马)是阿里ATH创新事业部发布的开源AI视频生成模型,以150亿参数、40层单流Transformer架构实现原生音视频同步生成。模型在Artificial Analysis AI Video Arena盲测中空降双榜第一:文生视频Elo 1332分、图生视频Elo 1391分,领先第二名字节Seedance 2.0近60-106分。采用DMD-2蒸馏技术,单张H100生成1080p视频仅需38秒,支持中英粤日韩德法7种语言及精准唇形同步。

HappyHorse-1.0 - 阿里ATH创新事业部开源的AI视频生成模型

HappyHorse-1.0的功能特色

  • 原生音视频一体化生成:单次前向推理同时输出视频与同步音频(对白、环境音、音效),无需后期配音及口型对齐,词错误率仅14.6%。
  • 三模态统一架构:40层单流Transformer(无交叉注意力),头尾4层为模态专属投影,中间32层共享参数,统一处理文本、视频、音频token。
  • 极速推理:DMD-2八步去噪技术,无需CFG引导,5秒预览仅需2秒,1080p完整生成约38秒。
  • 多语言唇形同步:支持英语、普通话、粤语、日语、韩语、德语、法语7种语言的原生语音生成与音素级口型匹配。
  • 多镜头叙事一致性:自动处理场景切换与复杂镜头运动,保持跨镜头角色形象、服装、环境的一致性。
  • 高品質出力:原生1080p/24fps,支持16:9、9:16等6种画幅,无需后期超分。

HappyHorse-1.0的核心优势

  • 盲测榜断层领先:在Artificial Analysis真实用户盲测中,文生视频与图生视频双榜登顶,领先第二名Seedance 2.0近60-74分,为历史最大分差。
  • 开源可商用:已宣布将发布完整模型权重、蒸馏版本、超分模块及推理代码,附带商业使用授权(GitHub/Hugging Face待上架)。
  • 极简架构高效率:纯自注意力单流设计摒弃复杂多流结构,参数量仅15B,推理成本显著低于闭源竞品。
  • 物理感知动作合成:在物体碰撞、布料飘动、流体动态等物理逻辑模拟上表现突出,人物肢体动作自然流畅。

HappyHorse-1.0官网是什么

官方暂未发布

HappyHorse-1.0的适用人群

  • ショートビデオクリエイター:快速生成TikTok、抖音、小红书等平台的高清带货视频与剧情短片。
  • 越境ECセラー:一键生成多语言产品演示视频,适配不同地区投放,支持7种语言。
  • 独立电影人/广告团队:低成本制作故事板预览、概念片与多镜头叙事片段,商业授权明确。
  • ゲーム開発者:将概念美术转为动态预览,验证镜头运动与角色动作一致性。
  • AI開発者:开源权重支持本地部署与微调,适合基于H100/A100(48GB+显存)的二次开发。

使用HappyHorse-1.0的操作步骤

  • 访问 Artificial Analysisアクセス 人工分析 官网 https://artificialanalysis.ai/,进入 Video Arena 盲测区。
  • 参与盲测投票:系统会随机展示两段匿名模型生成的视频(可能包含 HappyHorse),用户根据画质、动作流畅度等选择更优作品,点击「A 更好」或「B 更好」。
  • 查看模型身份:投票后页面会显示这两个视频分别来自哪个模型,若命中 HappyHorse,可看到其生成效果。

HappyHorse-1.0的常见问题FAQ

Q:HappyHorse真的是阿里做的吗?
A:已确认。阿里ATH方面4月10日回应称,HappyHorse是ATH创新事业部研发的模型,由前快手副总裁张迪带队,原属淘天未来生活实验室。


Q:模型是否真的开源?
A:官方已宣布开源并附带商用授权,但截至2026年4月10日,GitHub与Hugging Face仓库尚未完全上架权重文件,建议持续关注官方验证。


Q:普通用户何时能用上API?
A:阿里ATH确认将于近期开放API,阿里云计划同步上线百炼平台。


Q:与Seedance 2.0、可灵3.0相比如何?
A:在Artificial Analysis盲测中,HappyHorse-1.0文生视频Elo 1332分(vs Seedance 1273分)、图生视频Elo 1391分,双榜均超越Seedance 2.0与可灵3.0。


Q:生成视频最长多少秒?
A:目前公开版本支持5-8秒片段,免费试用版最长约5秒。


Q:本地部署需要什么配置?
A:需要NVIDIA H100或A100 GPU(至少48GB显存),支持FP8量化降低显存占用。


Q:支持中文提示词吗?
A:支持,且内置中文语音合成与精准唇形同步能力
© 著作権表示

関連記事

コメントなし

コメントに参加するにはログインが必要です!
今すぐログイン
なし
コメントはありません