AI个人学习
和实操指南
讯飞绘镜

OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

综合介绍

OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量的语音输出。OpenAI Edge TTS 支持多种语音选项和播放速度,能够生成多种音频格式。用户可以通过 Docker 或 Python 进行部署,方便快捷地使用该服务。

相关项目:edge-tts:文本转语音Python模块|免费文本转语音服务 、Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面


OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式-1

 

功能列表

  • OpenAI 兼容端点:支持与 OpenAI TTS 端点相同的请求结构和行为。
  • 多种语音支持:映射 OpenAI 语音到 Edge TTS 等效语音。
  • 灵活的音频格式:支持 MP3、Opus、AAC、FLAC、WAV、PCM 等多种音频格式。
  • 可调节播放速度:播放速度可在 0.25x 到 4.0x 之间调节。
  • 直接选择 Edge TTS 语音:可使用 OpenAI 语音映射或直接指定任何 Edge TTS 语音。

 

使用帮助

安装流程

使用 Docker 部署(推荐)

  1. 克隆仓库
   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts
  1. 创建环境变量文件: 在项目根目录下创建 .env 文件,包含以下变量:
   API_KEY=your_api_key_here
PORT=5050
DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2
DEFAULT_LANGUAGE=en-US
REQUIRE_API_KEY=True
REMOVE_FILTER=False
EXPAND_API=True
  1. 运行 Docker Compose
   docker compose up --build

若需在后台运行,使用 -d 参数:

   docker compose up -d

使用 Python 部署

  1. 克隆仓库
   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts
  1. 设置虚拟环境
   python3 -m venv venv
source venv/bin/activate
  1. 安装依赖
   pip install -r requirements.txt
  1. 创建环境变量文件: 在项目根目录下创建 .env 文件,包含上述变量。
  2. 运行服务器
   python app/main.py

使用说明

  1. 访问 API: 部署完成后,服务器将运行在 http://localhost:5050。可以通过发送 HTTP 请求访问 API 端点 /v1/audio/speech
  2. 生成语音: 发送 POST 请求到 /v1/audio/speech,请求体包含以下 JSON 数据:
   {
"text": "Hello, world!",
"voice": "en-US-AndrewNeural",
"format": "mp3",
"speed": 1.0
}
  1. 调整播放速度: 修改 speed 参数,范围为 0.25 到 4.0。
  2. 选择语音: 使用 voice 参数指定语音,支持的语音包括 alloy, echo, fable, onyx, nova, shimmer 等。
  3. 音频格式: 使用 format 参数指定音频格式,支持 mp3, opus, aac, flac, wav, pcm 等。

通过以上步骤,用户可以轻松部署和使用 OpenAI Edge TTS 服务,生成高质量的文本转语音输出。

未经允许不得转载:首席AI分享圈 » OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式
zh_CN简体中文