综合介绍
Voice Changer 是一个开源的实时语音变换工具,支持多种 AI 语音模型,如 MMVC、so-vits-svc、RVC、DDSP-SVC 和 Beatrice。该工具兼容多个平台,包括 Windows、Mac、Linux 和 Google Colab,用户可以通过简单的界面实时转换声音,适用于游戏、直播等多种场景。
相关项目:
本项目与 Vits 有着根本上的不同。Vits 是 TTS,本项目是 SVC。本项目无法实现 TTS,Vits 也无法实现 SVC,这两个项目的模型是完全不通用的。
功能列表
- 支持多种 AI 语音模型
- 实时语音转换
- 跨平台兼容(Windows、Mac、Linux、Google Colab)
- 简单易用的用户界面
- 支持 Docker 和 Anaconda 环境部署
- 提供预编译的二进制文件
- 支持 GPU 加速
使用帮助
安装流程
- 预编译二进制文件安装:
- 我们提供 Windows 和 Mac 版本。您可以从 Hugging Face 下载它。
- Windows 用户下载
vcclient_win_std_xxx.zip
或vcclient_win_cuda_xxx.zip
(适用于 NVIDIA GPU)。 - Mac 用户下载
vcclient_mac_xxx.zip
。 - 解压下载的文件,并运行其中的可执行文件。
- Docker 部署:
- 确保已安装 Docker。
- 克隆项目仓库:
git clone https://github.com/w-okada/voice-changer.git
- 进入项目目录:
cd voice-changer
- 构建 Docker 镜像:
docker build -t voice-changer .
- 运行 Docker 容器:
docker run -it --rm -p 5000:5000 voice-changer
- Anaconda 环境部署:
- 安装 Anaconda 并创建新环境:
conda create -n voice-changer python=3.8
- 激活环境:
conda activate voice-changer
- 安装依赖:
pip install -r requirements.txt
- 运行应用:
python app.py
- 安装 Anaconda 并创建新环境:
使用流程
- 启动应用:
- 运行预编译二进制文件或通过 Docker/Anaconda 启动应用后,打开浏览器访问
http://localhost:5000
。
- 运行预编译二进制文件或通过 Docker/Anaconda 启动应用后,打开浏览器访问
- 选择语音模型:
- 在界面中选择所需的 AI 语音模型(如 MMVC、so-vits-svc 等)。
- 配置输入输出设备:
- 配置麦克风作为输入设备,扬声器或耳机作为输出设备。
- 开始语音转换:
- 点击“开始”按钮,开始实时语音转换。
- 说话时,您的声音将被实时转换并通过输出设备播放。
- 调整设置:
- 根据需要调整转换参数,如音调、速度等,以获得最佳效果。
常见问题
- 声音延迟:确保使用高性能 CPU 或 GPU 以减少延迟。
- 音质问题:尝试不同的语音模型或调整参数设置。
- 连接问题:检查网络连接或重新启动应用。