HappyHorse-1.0 - 阿里ATH创新事业部开源的AI视频生成模型
HappyHorse-1.0是什么
HappyHorse-1.0(欢乐马)是阿里ATH创新事业部发布的开源AI视频生成模型,以150亿参数、40层单流Transformer架构实现原生音视频同步生成。模型在Artificial Analysis AI Video Arena盲测中空降双榜第一:文生视频Elo 1332分、图生视频Elo 1391分,领先第二名字节Seedance 2.0近60-106分。采用DMD-2蒸馏技术,单张H100生成1080p视频仅需38秒,支持中英粤日韩德法7种语言及精准唇形同步。

HappyHorse-1.0的功能特色
- 原生音视频一体化生成:单次前向推理同时输出视频与同步音频(对白、环境音、音效),无需后期配音及口型对齐,词错误率仅14.6%。
- 三模态统一架构:40层单流Transformer(无交叉注意力),头尾4层为模态专属投影,中间32层共享参数,统一处理文本、视频、音频token。
- 极速推理:DMD-2八步去噪技术,无需CFG引导,5秒预览仅需2秒,1080p完整生成约38秒。
- 多语言唇形同步:支持英语、普通话、粤语、日语、韩语、德语、法语7种语言的原生语音生成与音素级口型匹配。
- 多镜头叙事一致性:自动处理场景切换与复杂镜头运动,保持跨镜头角色形象、服装、环境的一致性。
- высокое качество продукции:原生1080p/24fps,支持16:9、9:16等6种画幅,无需后期超分。
HappyHorse-1.0的核心优势
- 盲测榜断层领先:在Artificial Analysis真实用户盲测中,文生视频与图生视频双榜登顶,领先第二名Seedance 2.0近60-74分,为历史最大分差。
- 开源可商用:已宣布将发布完整模型权重、蒸馏版本、超分模块及推理代码,附带商业使用授权(GitHub/Hugging Face待上架)。
- 极简架构高效率:纯自注意力单流设计摒弃复杂多流结构,参数量仅15B,推理成本显著低于闭源竞品。
- 物理感知动作合成:在物体碰撞、布料飘动、流体动态等物理逻辑模拟上表现突出,人物肢体动作自然流畅。
HappyHorse-1.0官网是什么
官方暂未发布
HappyHorse-1.0的适用人群
- Создатели коротких видеороликов:快速生成TikTok、抖音、小红书等平台的高清带货视频与剧情短片。
- Продавцы трансграничной электронной коммерции:一键生成多语言产品演示视频,适配不同地区投放,支持7种语言。
- 独立电影人/广告团队:低成本制作故事板预览、概念片与多镜头叙事片段,商业授权明确。
- разработчик игр:将概念美术转为动态预览,验证镜头运动与角色动作一致性。
- Разработчик искусственного интеллекта:开源权重支持本地部署与微调,适合基于H100/A100(48GB+显存)的二次开发。
使用HappyHorse-1.0的操作步骤
- 访问 Artificial Analysis: Доступ Искусственный анализ 官网 https://artificialanalysis.ai/,进入 Video Arena 盲测区。
- 参与盲测投票:系统会随机展示两段匿名模型生成的视频(可能包含 HappyHorse),用户根据画质、动作流畅度等选择更优作品,点击「A 更好」或「B 更好」。
- 查看模型身份:投票后页面会显示这两个视频分别来自哪个模型,若命中 HappyHorse,可看到其生成效果。
HappyHorse-1.0的常见问题FAQ
Q:HappyHorse真的是阿里做的吗?
A:已确认。阿里ATH方面4月10日回应称,HappyHorse是ATH创新事业部研发的模型,由前快手副总裁张迪带队,原属淘天未来生活实验室。
A:已确认。阿里ATH方面4月10日回应称,HappyHorse是ATH创新事业部研发的模型,由前快手副总裁张迪带队,原属淘天未来生活实验室。
Q:模型是否真的开源?
A:官方已宣布开源并附带商用授权,但截至2026年4月10日,GitHub与Hugging Face仓库尚未完全上架权重文件,建议持续关注官方验证。
A:官方已宣布开源并附带商用授权,但截至2026年4月10日,GitHub与Hugging Face仓库尚未完全上架权重文件,建议持续关注官方验证。
Q:普通用户何时能用上API?
A:阿里ATH确认将于近期开放API,阿里云计划同步上线百炼平台。
A:阿里ATH确认将于近期开放API,阿里云计划同步上线百炼平台。
Q:与Seedance 2.0、可灵3.0相比如何?
A:在Artificial Analysis盲测中,HappyHorse-1.0文生视频Elo 1332分(vs Seedance 1273分)、图生视频Elo 1391分,双榜均超越Seedance 2.0与可灵3.0。
A:在Artificial Analysis盲测中,HappyHorse-1.0文生视频Elo 1332分(vs Seedance 1273分)、图生视频Elo 1391分,双榜均超越Seedance 2.0与可灵3.0。
Q:生成视频最长多少秒?
A:目前公开版本支持5-8秒片段,免费试用版最长约5秒。
A:目前公开版本支持5-8秒片段,免费试用版最长约5秒。
Q:本地部署需要什么配置?
A:需要NVIDIA H100或A100 GPU(至少48GB显存),支持FP8量化降低显存占用。
A:需要NVIDIA H100或A100 GPU(至少48GB显存),支持FP8量化降低显存占用。
Q:支持中文提示词吗?
A:支持,且内置中文语音合成与精准唇形同步能力
A:支持,且内置中文语音合成与精准唇形同步能力
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...




