Sonic:全新数字人开源方案,音频驱动生成面部表情生动的数字人口播视频
综合介绍 Sonic 是一个专注于全球音频感知的创新平台,旨在通过音频驱动生成生动的肖像动画。该平台由腾讯和浙江大学的研究团队开发,利用音频信息来控制面部表情和头部运动,从而生成自然流畅的动画视频。Sonic ...
综合介绍 Sonic 是一个专注于全球音频感知的创新平台,旨在通过音频驱动生成生动的肖像动画。该平台由腾讯和浙江大学的研究团队开发,利用音频信息来控制面部表情和头部运动,从而生成自然流畅的动画视频。Sonic ...
综合介绍 悦动人像EMO是阿里云大模型服务平台百炼(Model Studio)提供的一款高质量人物肖像动态视频生成工具。该工具基于人物肖像图片和人声音频文件,生成逼真的人物肖像动态视频。悦动人像EMO包含两个独立的模...
综合介绍 DH_live 是一个基于少样本学习的实时直播数字人项目,旨在为用户提供流畅互动的直播体验。该项目支持 NVIDIA 30 和 40 系列显卡,能够以 25+ fps 的速度实时运行。用户可以通过简单的步骤创建和使用数字...
综合介绍 如影AI视频合成是由上海禹幻科技有限公司推出的一款AI视频生成平台。该平台依托商汤科技的“商汤日日新SenseNova”大模型能力,提供多种数字人形象和音色选择,用户只需输入文本即可生成逼真的AI视频。此...
综合介绍 蝉镜是一款专注于数字人视频创作的平台,利用AI技术简化视频制作过程。用户可以选择不同的数字人形象,输入文案并生成多语言配音的视频。平台提供丰富的模板和素材库,适用于广告营销、教育培训等多种场...
综合介绍 EchoMimic 是一个开源项目,旨在通过音频驱动生成逼真的肖像动画。该项目由蚂蚁集团的终端技术部门开发,利用可编辑的标志点条件,结合音频和面部标志点生成动态的肖像视频。EchoMimic 在多个公共数据集...
综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。该项目允许用户自定义数字人的形象与音色,并支持音色克隆及唇形同步...
综合介绍 Hallo2 是由复旦大学和百度联合开发的一个开源项目,旨在通过音频驱动生成高分辨率的人像动画。该项目利用先进的生成对抗网络(GAN)和时间对齐技术,实现了4K分辨率和长达1小时的视频生成。Hallo2 还支...
综合介绍 Ultralight Digital Human 是一个开源项目,旨在开发一个超轻量级的数字人模型,可以在移动设备上实时运行。该项目通过优化算法和模型结构,实现了在移动端设备上的流畅运行,适用于社交应用、游戏和虚...
综合介绍 TalkingAvatar 是一个领先的AI虚拟形象平台,提供完整AI数字人解决方案。提供用户创建、编辑和个性化视频内容的革命性方式。通过先进的AI技术,用户可以轻松重写视频、克隆语音、同步唇形,并创建自定义...