Introdução geral
Edge TTS Worker (dependências) borda-tts O Edge TTS Worker é um serviço de proxy implantado no Cloudflare Worker, que encapsula o serviço Microsoft Edge TTS em uma interface de API compatível com o formato OpenAI. Com esse projeto, os usuários podem usar facilmente o serviço de síntese de fala de alta qualidade da Microsoft sem a certificação da Microsoft. O Edge TTS Worker oferece suporte a vários idiomas, incluindo chinês, inglês, japonês, coreano etc., e é totalmente gratuito, com base no Cloudflare Worker Free Plan. O serviço também suporta chaves de API personalizadas para garantir a segurança e o controle, e pode ser implantado rapidamente, em minutos.
Um projeto para empacotar uma interface simples para a API
Lista de funções
- Fornece formatos de interface compatíveis com o OpenAI
- Ignorar as restrições de acesso ao continente e eliminar a etapa de autenticação do serviço Microsoft
- Suporte a vários idiomas, incluindo chinês, inglês, japonês, coreano, etc.
- Totalmente gratuito, com base no Cloudflare Worker Free Plan
- Suporte para chaves de API personalizadas para garantir a segurança e o controle
- Implementação rápida, pronta em minutos
- Fornecer scripts de teste para testar diferentes efeitos de voz
Usando a Ajuda
Processo de instalação
- Criação de um trabalhador
- Faça login no painel de controle da Cloudflare
- Vá para Workers & Pages e clique em Create Worker.
- Dê um nome ao trabalhador (por exemplo, edge-tts)
- Código de implantação
- Remover o código padrão do editor
- fazer uma cópia de
worker.js
e cole o código no campo - Clique em Salvar e implementar
- Configuração da chave de API (opcional)
- Localize Settings -> Variables (Configurações -> Variáveis) na página de configurações do Worker.
- Clique em Add variable (Adicionar variável), preencha API_KEY com o nome e o valor da chave que você deseja.
- Clique em Salvar e implementar
- Configurar um nome de domínio personalizado (opcional)
- Pré-requisitos: seu domínio já está hospedado na Cloudflare e os registros de DNS para o domínio foram submetidos a proxy por meio da Cloudflare (o status do proxy é nuvem laranja)
- Etapas de configuração:
- Clique na guia Configurações na página de detalhes do trabalhador.
- Localize a seção Domain and Routing (Domínio e roteamento) e clique no botão Add (Adicionar).
- Selecione Custom Domain (Domínio personalizado) e digite o nome de domínio que deseja usar (por exemplo, tts.example.com)
- Clique em Add Domain (Adicionar domínio) e aguarde a conclusão da implementação do certificado (geralmente em alguns minutos)
Uso
- TTY (interface de conversão de texto em fala)
- Exemplo de discurso em chinês:
curl -X POST https://你的worker地址/v1/audio/speech \\ -H "Content-Type: application/json" \\\ -H "Authorization: Bearer your-api-key" \\ -d '{ "model": "tts-1", "input": "Hello". "input": "Hello, world!" , "voice": "zh-CN-XiaoxiaoNeural", "speed": 1,0, "response_format". "campo": 1.0, "style": "general" }' --output chinese.mp3
- Exemplo de discurso em inglês:
curl -X POST https://你的worker地址/v1/audio/speech \\ -H "Content-Type: application/json" \\\ -H "Authorization: Bearer your-api-key" \\ -d '{ "model": "tts-1", "input": "Hello World". "input": "Hello, World!", "voice": "en-US". "voice": "en-US-JennyNeural", "pitch": 1,0, "style": "general". "style": "general" }' --output english.mp3
- Uso do script de teste
- Download do script de teste
test_voices.sh
- Adicione permissões de execução ao script:
bash
chmod +x test_voices.sh
- Execute o script:
bash
. /test_voices.sh [chave da API].
- Exemplo:
bash
# Usar chave de API
. /test_voices.sh https://your-worker.workers.dev your-api-key
# não usa uma chave de API
. /test_voices.sh https://your-worker.workers.dev
- O script gera arquivos de áudio de teste para cada voz suportada, que você pode reproduzir para selecionar a voz mais adequada.
- Download do script de teste
Descrição do parâmetro da API
modelo
(string): nome do modelo (valor fixo), por exemplotts-1
entrada
(string): o texto a ser convertido, por exemplo"Olá, mundo!"
voz
(string): nome da voz, por exemplozh-CN-XiaoxiaoNeural
formato_de_resposta
(string, opcional): formato de saída, o valor padrão émp3
velocidade
(número, opcional): taxa de fala (0,5-2,0), padrão1.0
campo
(número, opcional): tom (0,5-2,0), o padrão é1.0
estilo
(string, opcional): emoção, o padrão égeral
Lista de vozes compatíveis
Certifique-se de usar o texto do idioma correspondente à voz, por exemplo, a voz em chinês deve ser usada com o texto em chinês. Veja a seguir exemplos de vozes comumente usadas:
zh-CN-XiaoxiaoNeural
Xiaoxiao - Caloroso e animadozh-CN-XiaoyiNeural
Xiaoyi - Calor e gentilezazh-CN-YunxiNeural
Yumshi - voz masculina, estávelzh-CN-YunyangNeural
Yun Yang - voz masculina, profissionalzh-CN-XiaohanNeural
: Xiaohan - Natural Flowzh-CN-XiaomengNeural
Xiaomeng - Doce e vibrantezh-CN-XiaochenNeural
Xiaochen - Gentil e fácil- Espere...