OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

71.3K 00

综合介绍

OpenAI Edge TTS 是一个开源项目，提供与 OpenAI 兼容的本地文本转语音（TTS）API。该项目使用 Microsoft Edge 的在线文本转语音服务，允许用户生成高质量的语音输出。OpenAI Edge TTS 支持多种语音选项和播放速度，能够生成多种音频格式。用户可以通过 Docker 或 Python 进行部署，方便快捷地使用该服务。

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

功能列表

OpenAI 兼容端点：支持与 OpenAI TTS 端点相同的请求结构和行为。
多种语音支持：映射 OpenAI 语音到 Edge TTS 等效语音。
灵活的音频格式：支持 MP3、Opus、AAC、FLAC、WAV、PCM 等多种音频格式。
可调节播放速度：播放速度可在 0.25x 到 4.0x 之间调节。
直接选择 Edge TTS 语音：可使用 OpenAI 语音映射或直接指定任何 Edge TTS 语音。

使用帮助

安装流程

使用 Docker 部署（推荐）

克隆仓库：

   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

创建环境变量文件：在项目根目录下创建 .env 文件，包含以下变量：

   API_KEY=your_api_key_here
PORT=5050
DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2
DEFAULT_LANGUAGE=en-US
REQUIRE_API_KEY=True
REMOVE_FILTER=False
EXPAND_API=True

运行 Docker Compose：

   docker compose up --build

若需在后台运行，使用 -d 参数：

   docker compose up -d

使用 Python 部署

克隆仓库：

   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

设置虚拟环境：

   python3 -m venv venv
source venv/bin/activate

安装依赖：

   pip install -r requirements.txt

创建环境变量文件：在项目根目录下创建 .env 文件，包含上述变量。
运行服务器：

   python app/main.py

使用说明

访问 API：部署完成后，服务器将运行在 http://localhost:5050。可以通过发送 HTTP 请求访问 API 端点 /v1/audio/speech。
生成语音：发送 POST 请求到 /v1/audio/speech，请求体包含以下 JSON 数据：

   {
"text": "Hello, world!",
"voice": "en-US-AndrewNeural",
"format": "mp3",
"speed": 1.0
}

调整播放速度：修改 speed 参数，范围为 0.25 到 4.0。
选择语音：使用 voice 参数指定语音，支持的语音包括 alloy, echo, fable, onyx, nova, shimmer 等。
音频格式：使用 format 参数指定音频格式，支持 mp3, opus, aac, flac, wav, pcm 等。