综合介绍
OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量的语音输出。OpenAI Edge TTS 支持多种语音选项和播放速度,能够生成多种音频格式。用户可以通过 Docker 或 Python 进行部署,方便快捷地使用该服务。
相关项目:edge-tts:文本转语音Python模块|免费文本转语音服务 、Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面
功能列表
- OpenAI 兼容端点:支持与 OpenAI TTS 端点相同的请求结构和行为。
- 多种语音支持:映射 OpenAI 语音到 Edge TTS 等效语音。
- 灵活的音频格式:支持 MP3、Opus、AAC、FLAC、WAV、PCM 等多种音频格式。
- 可调节播放速度:播放速度可在 0.25x 到 4.0x 之间调节。
- 直接选择 Edge TTS 语音:可使用 OpenAI 语音映射或直接指定任何 Edge TTS 语音。
使用帮助
安装流程
使用 Docker 部署(推荐)
- 克隆仓库:
git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts
- 创建环境变量文件: 在项目根目录下创建
.env
文件,包含以下变量:
API_KEY=your_api_key_here
PORT=5050
DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2
DEFAULT_LANGUAGE=en-US
REQUIRE_API_KEY=True
REMOVE_FILTER=False
EXPAND_API=True
- 运行 Docker Compose:
docker compose up --build
若需在后台运行,使用 -d
参数:
docker compose up -d
使用 Python 部署
- 克隆仓库:
git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts
- 设置虚拟环境:
python3 -m venv venv
source venv/bin/activate
- 安装依赖:
pip install -r requirements.txt
- 创建环境变量文件: 在项目根目录下创建
.env
文件,包含上述变量。 - 运行服务器:
python app/main.py
使用说明
- 访问 API: 部署完成后,服务器将运行在
http://localhost:5050
。可以通过发送 HTTP 请求访问 API 端点/v1/audio/speech
。 - 生成语音: 发送 POST 请求到
/v1/audio/speech
,请求体包含以下 JSON 数据:
{
"text": "Hello, world!",
"voice": "en-US-AndrewNeural",
"format": "mp3",
"speed": 1.0
}
- 调整播放速度: 修改
speed
参数,范围为 0.25 到 4.0。 - 选择语音: 使用
voice
参数指定语音,支持的语音包括alloy
,echo
,fable
,onyx
,nova
,shimmer
等。 - 音频格式: 使用
format
参数指定音频格式,支持mp3
,opus
,aac
,flac
,wav
,pcm
等。
通过以上步骤,用户可以轻松部署和使用 OpenAI Edge TTS 服务,生成高质量的文本转语音输出。