Retrieval based Voice Conversion WebUI：基于检索的语音转换框架|模拟真人歌声

最新AI资源2年前发布 AI分享圈

66.7K 00

综合介绍

Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架，可以实现任意说话人之间的语音转换，包括歌曲的翻唱和实时的变声。它具有低延迟、优秀的变声效果、少量数据训练等特点，支持N卡、A卡、I卡的加速，提供网页界面和实时变声界面，还可以调用UVR5模型来快速分离人声和伴奏，使用最先进的人声音高提取算法RMVPE来根绝哑音问题。

colab在线体验

底模使用接近50小时的开源高质量VCTK训练集训练，无版权方面的顾虑，请大家放心使用
请期待RVCv3的底模，参数更大，数据更大，效果更好，基本持平的推理速度，需要训练数据量更少。

Retrieval based Voice Conversion WebUI：基于检索的语音转换框架|模拟真人歌声

训练推理界面

Retrieval based Voice Conversion WebUI：基于检索的语音转换框架|模拟真人歌声

实时变声界面

功能列表

训练自己的语音转换模型，只需10分钟的语音数据即可
使用预训练的语音转换模型，支持多种采样率和音色
使用网页界面或实时变声界面进行语音转换，支持端到端的低延迟
使用UVR5模型来分离人声和伴奏，支持多种格式的音频文件
使用RMVPE算法来提取人声音高，支持pytorch/onnx/DirectML

使用帮助

下载或克隆本仓库，安装所需的依赖和预模型
运行go-web.bat或go-realtime-gui.bat，选择想要执行的操作
根据界面提示，选择输入和输出的语音文件或设备，调整参数和选项
点击开始或停止，享受语音转换的乐趣

最新AI资源 # AI开源项目 # AI语音克隆

© 版权声明

文章版权归 AI分享圈所有，未经允许请勿转载。

相关文章

Orate：集成知名语音生成、语音转录与变声模型的统一API

Orate：集成知名语音生成、语音转录与变声模型的统一API

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音转文本

1年前

063.9K

PantoMatrix（EMAGE）：全身手势生成框架，从音频生成全身手势的3D动画框架

PantoMatrix（EMAGE）：全身手势生成框架，从音频生成全身手势的3D动画框架

最新AI资源 # AI开源项目

1年前

060.4K

Index-AniSora - B站推出的开源动漫视频生成模型

Index-AniSora - B站推出的开源动漫视频生成模型

10个月前

057.2K

Genspark2api（失效）

Genspark2api（失效）

最新AI资源 # AI开源项目 # 免费大模型API

1年前

053.2K

暂无评论

您必须登录才能参与评论！

none

暂无评论...