OpenAI Edge TTS: uma API gratuita de conversão de texto em fala usando o Edge TTS, compatível com o formato OpenAI

🚀 Convite para experimentar: o primeiro software de programação inteligente AI IDE da China Download da versão chinesa do TraeO DeepSeek-R1 e o Doubao-pro estão disponíveis em uma base ilimitada!

Introdução geral

O OpenAI Edge TTS é um projeto de código aberto que fornece uma API de conversão de texto em fala (TTS) nativa compatível com a OpenAI que usa o serviço de conversão de texto em fala on-line do Microsoft Edge para permitir que os usuários gerem uma saída de fala de alta qualidade. O OpenAI Edge TTS oferece suporte a uma ampla gama de opções de fala e velocidades de reprodução, e pode gerar vários formatos de áudio. O serviço pode ser implantado via Docker ou Python para acesso rápido e fácil.

Itens relacionados:edge-tts: módulo Python de conversão de texto em fala | Serviço gratuito de conversão de texto em fala eEdge TTS Worker: implantação de APIs de síntese de fala da Microsoft usando Cloudflare, formato compatível com OpenAI e interface da Web empacotada

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式-1

Lista de funções

Pontos de extremidade compatíveis com OpenAISuporte para a mesma estrutura e comportamento de solicitação que os endpoints OpenAI TTS.
Suporte a várias vozesMapeamento de fala OpenAI para fala equivalente ao Edge TTS.
Formatos de áudio flexíveisSuporte a MP3, Opus, AAC, FLAC, WAV, PCM e muitos outros formatos de áudio.
Velocidade de reprodução ajustávelVelocidade de reprodução: A velocidade de reprodução pode ser ajustada de 0,25x a 4,0x.
Seleção direta da voz do Edge TTSVoz: Você pode usar o mapeamento de voz da OpenAI ou especificar qualquer voz do Edge TTS diretamente.

Usando a Ajuda

Processo de instalação

Implementação com o Docker (recomendado)

armazém de clones::

   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

Criação de um arquivo de variável de ambienteCriar no diretório raiz do projeto .env contendo as seguintes variáveis:

   API_KEY=your_api_key_here
PORT=5050
DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2
DEFAULT_LANGUAGE=en-US
REQUIRE_API_KEY=True
REMOVE_FILTER=False
EXPAND_API=True

Executando o Docker Compose::

   docker compose up --build

Para executar em segundo plano, use o comando -d Parâmetros:

   docker compose up -d

Implementação com Python

armazém de clones::

   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

Configuração de um ambiente virtual::

   python3 -m venv venv
source venv/bin/activate

Instalação de dependências::

   pip install -r requirements.txt

Criação de um arquivo de variável de ambienteCriar no diretório raiz do projeto .env que contém as variáveis acima.
Servidor de operações::

   python app/main.py

Instruções de uso

Acessando a APIQuando a implantação estiver concluída, o servidor executará http://localhost:5050O ponto de extremidade da API pode ser acessado enviando uma solicitação HTTP. O ponto de extremidade da API pode ser acessado enviando uma solicitação HTTP para /v1/audio/speech.
Gerar discursoenvia uma solicitação POST para /v1/audio/speechO corpo da solicitação contém os seguintes dados JSON:

   {
"text": "Hello, world!",
"voice": "en-US-AndrewNeural",
"format": "mp3",
"speed": 1.0
}

Ajuste da velocidade de reproduçãoModificação speed variando de 0,25 a 4,0.
Selecionar voz: Uso voice O parâmetro especifica a voz; as vozes compatíveis incluem alloy, echo, fable, onyx, nova, shimmer etc.
formato de áudio: Uso format especifica o formato de áudio, que suporta mp3, opus, aac, flac, wav, pcm etc.

Com essas etapas, os usuários podem implementar e usar facilmente o serviço OpenAI Edge TTS para gerar resultados de conversão de texto em fala de alta qualidade.

OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Implementação com o Docker (recomendado)

Implementação com Python

Instruções de uso

Artigos relacionados

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Gerador de imagens FLUX.1 (suporta entrada em chinês)

Hotspots de IA recentes

Recomendações de ferramentas de IA

Classificação das ferramentas de IA