OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI

Recursos mais recentes de IAAtualizado há 8 meses Círculo de compartilhamento de IA

22.5K 00

Introdução geral

O OpenAI Edge TTS é um projeto de código aberto que fornece uma API de conversão de texto em fala (TTS) nativa compatível com a OpenAI que usa o serviço de conversão de texto em fala on-line do Microsoft Edge para permitir que os usuários gerem uma saída de fala de alta qualidade. O OpenAI Edge TTS oferece suporte a uma ampla gama de opções de fala e velocidades de reprodução, e pode gerar vários formatos de áudio. O serviço pode ser implantado via Docker ou Python para acesso rápido e fácil.

Itens relacionados:edge-tts: módulo Python de conversão de texto em fala | Serviço gratuito de conversão de texto em fala eEdge TTS Worker: implantação de APIs de síntese de fala da Microsoft usando Cloudflare, formato compatível com OpenAI e interface da Web empacotada

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

Lista de funções

Pontos de extremidade compatíveis com OpenAISuporte para a mesma estrutura e comportamento de solicitação que os endpoints OpenAI TTS.
Suporte a várias vozesMapeamento de fala OpenAI para fala equivalente ao Edge TTS.
Formatos de áudio flexíveisSuporte a MP3, Opus, AAC, FLAC, WAV, PCM e muitos outros formatos de áudio.
Velocidade de reprodução ajustávelVelocidade de reprodução: A velocidade de reprodução pode ser ajustada de 0,25x a 4,0x.
Seleção direta da voz do Edge TTSVoz: Você pode usar o mapeamento de voz da OpenAI ou especificar qualquer voz do Edge TTS diretamente.

Usando a Ajuda

Processo de instalação

Implementação com o Docker (recomendado)

armazém de clones::

   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

Criação de um arquivo de variável de ambienteCriar no diretório raiz do projeto .env contendo as seguintes variáveis:

   API_KEY=your_api_key_here
PORT=5050
DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2
DEFAULT_LANGUAGE=en-US
REQUIRE_API_KEY=True
REMOVE_FILTER=False
EXPAND_API=True

Executando o Docker Compose::

   docker compose up --build

Para executar em segundo plano, use o comando -d Parâmetros:

   docker compose up -d

Implementação com Python

armazém de clones::

   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

Configuração de um ambiente virtual::

   python3 -m venv venv
source venv/bin/activate

Instalação de dependências::

   pip install -r requirements.txt

Criação de um arquivo de variável de ambienteCriar no diretório raiz do projeto .env que contém as variáveis acima.
Servidor de operações::

   python app/main.py

Instruções de uso

Acessando a APIQuando a implantação estiver concluída, o servidor executará http://localhost:5050O ponto de extremidade da API pode ser acessado enviando uma solicitação HTTP. O ponto de extremidade da API pode ser acessado enviando uma solicitação HTTP para /v1/audio/speech.
Gerar discursoenvia uma solicitação POST para /v1/audio/speechO corpo da solicitação contém os seguintes dados JSON:

   {
"text": "Hello, world!",
"voice": "en-US-AndrewNeural",
"format": "mp3",
"speed": 1.0
}

Ajuste da velocidade de reproduçãoModificação speed variando de 0,25 a 4,0.
Selecionar voz: Uso voice O parâmetro especifica a voz; as vozes compatíveis incluem alloy, echo, fable, onyx, nova, shimmer etc.
formato de áudio: Uso format especifica o formato de áudio, que suporta mp3, opus, aac, flac, wav, pcm etc.

Com essas etapas, os usuários podem implementar e usar facilmente o serviço OpenAI Edge TTS para gerar resultados de conversão de texto em fala de alta qualidade.

Recursos mais recentes de IA # Projeto de código aberto AI Java # Conversão de texto em fala com IA

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

Relationchips: um assistente de IA para consulta e visualização de dados em linguagem natural

Recursos mais recentes de IA # Análise de dados de IA

5 meses atrás

017.2K

Narrative BI：连接多种电子表格数据进行对话查询，并生成商业洞察（付费）

Narrative BI: vinculação de dados de várias planilhas para consultas de diálogo e geração de insights de negócios (pago)

Recursos mais recentes de IA # Análise de dados de IA

8 meses atrás

016.5K

cognee: uma estrutura de código aberto para a construção de RAGs com base em gráficos de conhecimento, aprendizagem de prompts centrais

Recursos mais recentes de IA # Projeto de código aberto AI Java # Gráfico de conhecimento # Recuperação de conhecimento e estrutura RAG

8 meses atrás

023.3K

n8n - Plataforma de criação de fluxo de trabalho de IA de código aberto para criar visualmente fluxos de trabalho complexos

Recursos mais recentes de IA

3 meses atrás

018.9K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Implementação com o Docker (recomendado)

Implementação com Python

Instruções de uso

Charts Not Chapters: Documentação para gerar rapidamente gráficos de visualização de dados (infográficos)

UGCGenerator: anúncios em vídeo com conteúdo personalizado gerado por IA viralizam com facilidade

Artigos relacionados

Relationchips: um assistente de IA para consulta e visualização de dados em linguagem natural

Narrative BI: vinculação de dados de várias planilhas para consultas de diálogo e geração de insights de negócios (pago)

cognee: uma estrutura de código aberto para a construção de RAGs com base em gráficos de conhecimento, aprendizagem de prompts centrais

n8n - Plataforma de criação de fluxo de trabalho de IA de código aberto para criar visualmente fluxos de trabalho complexos

Sem comentários

Últimas coleções

Artigos mais recentes

OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Implementação com o Docker (recomendado)

Implementação com Python

Instruções de uso

Charts Not Chapters: Documentação para gerar rapidamente gráficos de visualização de dados (infográficos)

UGCGenerator: anúncios em vídeo com conteúdo personalizado gerado por IA viralizam com facilidade

Artigos relacionados

Relationchips: um assistente de IA para consulta e visualização de dados em linguagem natural

Narrative BI: vinculação de dados de várias planilhas para consultas de diálogo e geração de insights de negócios (pago)

cognee: uma estrutura de código aberto para a construção de RAGs com base em gráficos de conhecimento, aprendizagem de prompts centrais

n8n - Plataforma de criação de fluxo de trabalho de IA de código aberto para criar visualmente fluxos de trabalho complexos

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes