DreamTalk：使用一张头像图片即可生成表情丰富的说话视频

最新AI资源1年前更新 AI分享圈

72.7K 00

DreamTalk 综合介绍

DreamTalk是一个扩散模型驱动的表情说话头生成框架，由清华大学、阿里巴巴集团和华中科技大学联合开发。主要由降噪网络、风格感知嘴唇专家和风格预测器三部分构成，能够基于音频输入生成多样而真实的说话头像。该框架能处理多种语言和噪声音频，提供高质量的面部运动和准确的嘴型同步。

DreamTalk：使用一张头像图片即可生成表情丰富的说话视频

DreamTalk 功能列表

根据音频生成逼真的说话头部视频
支持多种语言和语音输入
支持多种风格和表情的输出
支持自定义人物头像和风格参考
支持在线演示和代码下载

DreamTalk 使用帮助

访问项目主页查看更多信息和演示视频
访问论文地址阅读技术细节和实验结果
访问GitHub地址下载代码和预训练模型
遵循安装指南配置环境和依赖
运行inference_for_demo_video.py进行推理和生成视频
根据参数说明调整输入和输出选项

DreamTalk在线体验地址

DreamTalk开源地址

DreamTalk colab运行环境

最新AI资源 # AI开源项目 # AI数字人 # 口型同步

© 版权声明

文章版权归 AI分享圈所有，未经允许请勿转载。

相关文章

UI-TARS Desktop：使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop：使用自然语言控制电脑的桌面智能体应用

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

093.7K

ImageTranslate：快速翻译图片文字的在线工具

ImageTranslate：快速翻译图片文字的在线工具

最新AI资源 # AI翻译

1年前

060.5K

Goku: 生成画面精细且一致的视频，适合创作包含人物、物体细节的广告视频

Goku: 生成画面精细且一致的视频，适合创作包含人物、物体细节的广告视频

最新AI资源 # AI图像转视频 # AI开源项目 # AI文本转视频

1年前

053K

Infography：文本、链接或文档转换为精美信息图，适合小红书等自媒体传播

Infography：文本、链接或文档转换为精美信息图，适合小红书等自媒体传播

最新AI资源 # AI文本与音频/视频总结工具 # AI白板与信息图

1年前

058.5K

暂无评论

您必须登录才能参与评论！

none

暂无评论...