AI个人学习
和实操指南

Ultralight-Digital-Human:手机设备即可实时运行的超轻量级数字人模型

综合介绍

Ultralight Digital Human 是一个开源项目,旨在开发一个超轻量级的数字人模型,可以在移动设备上实时运行。该项目通过优化算法和模型结构,实现了在移动端设备上的流畅运行,适用于社交应用、游戏和虚拟现实等多种场景。用户可以轻松训练和部署自己的数字人模型,享受个性化和沉浸式的体验。

关于在移动端上运行也是没问题的,只需要把现在这个模型通道数改小一点,音频特征用wenet就没问题了。


 

功能列表

  • 实时运行:模型可以在移动设备上实时运行,响应迅速。
  • 轻量级设计:优化后的模型结构,适合资源有限的移动设备。
  • 开源项目:代码和模型完全开源,用户可以自由修改和使用。
  • 多场景应用:适用于社交应用、游戏、虚拟现实等多种场景。
  • 音频特征提取:支持 wenet 和 hubert 两种音频特征提取方案。
  • 同步网络:通过 syncnet 技术提升唇形同步效果。
  • 详细教程:提供详细的训练和使用教程,帮助用户快速上手。

 

使用帮助

安装流程

  1. 环境准备
    • 安装 Python 3.10 及以上版本。
    • 安装 PyTorch 1.13.1 及其他依赖库:
      conda create -n dh python=3.10
      conda activate dh
      conda install pytorch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1 pytorch-cuda=11.7 -c pytorch -c nvidia
      conda install mkl=2024.0
      pip install opencv-python transformers numpy==1.23.5 soundfile librosa onnxruntime
      
  2. 下载模型文件
    • 从以下链接下载 wenet encoder.onnx 文件,并放置在 data_utils/ 目录下: 下载链接

使用流程

  1. 准备视频
    • 准备一个 3-5 分钟的视频,确保每一帧都有完整的面部曝光,声音清晰无杂音。
    • 将视频放置在一个新的文件夹中。
  2. 提取音频特征
    • 使用以下命令提取音频特征:
      cd data_utils
      python process.py YOUR_VIDEO_PATH --asr hubert
      
  3. 训练模型
    • 训练 syncnet 模型以获得更好的效果:
      cd ..
      python syncnet.py --save_dir ./syncnet_ckpt/ --dataset_dir ./data_dir/ --asr hubert
      
    • 使用最低 loss 的 checkpoint 训练数字人模型:
      python train.py --dataset_dir ./data_dir/ --save_dir ./checkpoint/ --asr hubert --use_syncnet --syncnet_checkpoint syncnet_ckpt
      
  4. 推理
    • 提取测试音频特征:
      python extract_test_audio.py YOUR_TEST_AUDIO_PATH --asr hubert
      
    • 运行推理:
      python inference.py --dataset ./data_dir/ --audio_feat ./your_test_audio_hu.npy --save_path ./output.mp4 --checkpoint ./checkpoint/best_model.pth
      

注意事项

  • 确保视频帧率与所选的音频特征提取方案匹配:wenet 为 20fps,hubert 为 25fps。
  • 在训练和推理过程中,定期监控模型的 loss 值,选择最优的 checkpoint 进行训练。
AI轻松学

普通人的AI入门指南

帮助你以低成本、零基础学会如何利用AI工具。AI就像办公软件一样,是每个人的必备技能。 掌握AI会让你在求职中占据优势,在未来的工作和学习中事半功倍。

查看详情>
未经允许不得转载:首席AI分享圈 » Ultralight-Digital-Human:手机设备即可实时运行的超轻量级数字人模型

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文