综合介绍
Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音(TTS)工具。该项目由thewh1teagle开发,旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持多种语言,包括英语,并计划支持法语、日语、韩语和中文。该工具具有多种声音选择,包括低语模式,且性能优越,能够在macOS M1上接近实时运行。Kokoro-ONNX的轻量级设计使其易于安装和使用,适合需要高效TTS解决方案的开发者和研究人员。
功能列表
- 支持多种语言的文本转语音(TTS)
- 多种声音选择,包括低语模式
- 高效性能,接近实时运行
- 轻量级设计,安装包约300MB(量化后约80MB)
- 兼容macOS M1
- 开源,基于MIT和Apache 2.0许可证
使用帮助
安装流程
- 打开终端(PowerShell / Bash)。
- 运行以下命令安装Kokoro-ONNX:
pip install -U kokoro-onnx
- 下载所需文件
kokoro-v0_19.onnx
和voices.json
,并将它们放置在同一目录下。
使用方法
- 在终端中运行以下命令启动Kokoro-ONNX:
uv init -p 3.12
uv add kokoro-onnx soundfile
- 将
examples/save.py
中的内容粘贴到hello.py
中。 - 下载文件
kokoro-v0_19.onnx
和voices.json
,并将它们放置在同一目录下。 - 运行以下命令生成语音:
python hello.py
功能操作流程
- 选择语言和声音:在
voices.json
中选择所需的语言和声音。 - 输入文本:在
hello.py
中输入需要转换为语音的文本。 - 生成语音:运行脚本后,生成的语音文件将保存在指定目录中。
特色功能
- 多语言支持:Kokoro-ONNX目前支持英语,并计划支持更多语言,如法语、日语、韩语和中文。
- 多种声音选择:用户可以选择不同的声音,包括低语模式,满足不同场景需求。
- 高效性能:在macOS M1上接近实时运行,适合需要快速响应的应用场景。
- 轻量级设计:安装包体积小,便于快速部署和使用。
通过以上步骤,用户可以轻松安装和使用Kokoro-ONNX,实现高效的文本转语音功能。详细的操作流程和丰富的功能介绍,确保用户能够快速上手并充分利用该工具的优势。