Aprendizagem pessoal com IA
e orientação prática

Edge TTS Worker: implantação de APIs de síntese de fala da Microsoft usando Cloudflare, formato compatível com OpenAI e interface da Web empacotada

Introdução geral

Edge TTS Worker (dependências) borda-tts O Edge TTS Worker é um serviço de proxy implantado no Cloudflare Worker, que encapsula o serviço Microsoft Edge TTS em uma interface de API compatível com o formato OpenAI. Com esse projeto, os usuários podem usar facilmente o serviço de síntese de fala de alta qualidade da Microsoft sem a certificação da Microsoft. O Edge TTS Worker oferece suporte a vários idiomas, incluindo chinês, inglês, japonês, coreano etc., e é totalmente gratuito, com base no Cloudflare Worker Free Plan. O serviço também suporta chaves de API personalizadas para garantir a segurança e o controle, e pode ser implantado rapidamente, em minutos.

Um projeto para empacotar uma interface simples para a API


Edge TTS Worker: implantação da API de síntese de fala da Microsoft usando o Cloudflare, compatível com o formato OpenAI e empacotamento da interface da Web-1

 

Lista de funções

  • Fornece formatos de interface compatíveis com o OpenAI
  • Ignorar as restrições de acesso ao continente e eliminar a etapa de autenticação do serviço Microsoft
  • Suporte a vários idiomas, incluindo chinês, inglês, japonês, coreano, etc.
  • Totalmente gratuito, com base no Cloudflare Worker Free Plan
  • Suporte para chaves de API personalizadas para garantir a segurança e o controle
  • Implementação rápida, pronta em minutos
  • Fornecer scripts de teste para testar diferentes efeitos de voz

 

Usando a Ajuda

Processo de instalação

  1. Criação de um trabalhador
    • Faça login no painel de controle da Cloudflare
    • Vá para Workers & Pages e clique em Create Worker.
    • Dê um nome ao trabalhador (por exemplo, edge-tts)
  2. Código de implantação
    • Remover o código padrão do editor
    • fazer uma cópia de worker.js e cole o código no campo
    • Clique em Salvar e implementar
  3. Configuração da chave de API (opcional)
    • Localize Settings -> Variables (Configurações -> Variáveis) na página de configurações do Worker.
    • Clique em Add variable (Adicionar variável), preencha API_KEY com o nome e o valor da chave que você deseja.
    • Clique em Salvar e implementar
  4. Configurar um nome de domínio personalizado (opcional)
    • Pré-requisitos: seu domínio já está hospedado na Cloudflare e os registros de DNS para o domínio foram submetidos a proxy por meio da Cloudflare (o status do proxy é nuvem laranja)
    • Etapas de configuração:
      • Clique na guia Configurações na página de detalhes do trabalhador.
      • Localize a seção Domain and Routing (Domínio e roteamento) e clique no botão Add (Adicionar).
      • Selecione Custom Domain (Domínio personalizado) e digite o nome de domínio que deseja usar (por exemplo, tts.example.com)
      • Clique em Add Domain (Adicionar domínio) e aguarde a conclusão da implementação do certificado (geralmente em alguns minutos)

Uso

  1. TTY (interface de conversão de texto em fala)
    • Exemplo de discurso em chinês:
     curl -X POST https://你的worker地址/v1/audio/speech \\
    -H "Content-Type: application/json" \\\
    -H "Authorization: Bearer your-api-key" \\
    -d '{
    "model": "tts-1", "input": "Hello".
    "input": "Hello, world!" ,
    "voice": "zh-CN-XiaoxiaoNeural",
    
    "speed": 1,0, "response_format".
    "campo": 1.0,
    "style": "general"
    }' --output chinese.mp3
    
    • Exemplo de discurso em inglês:
     curl -X POST https://你的worker地址/v1/audio/speech \\
    -H "Content-Type: application/json" \\\
    -H "Authorization: Bearer your-api-key" \\
    -d '{
    "model": "tts-1", "input": "Hello World".
    "input": "Hello, World!", "voice": "en-US".
    "voice": "en-US-JennyNeural",
    
    
    "pitch": 1,0, "style": "general".
    "style": "general"
    }' --output english.mp3
    
  2. Uso do script de teste
    • Download do script de teste test_voices.sh
    • Adicione permissões de execução ao script: bash
      chmod +x test_voices.sh
    • Execute o script: bash
      . /test_voices.sh [chave da API].
    • Exemplo: bash
      # Usar chave de API
      . /test_voices.sh https://your-worker.workers.dev your-api-key
      # não usa uma chave de API
      . /test_voices.sh https://your-worker.workers.dev
    • O script gera arquivos de áudio de teste para cada voz suportada, que você pode reproduzir para selecionar a voz mais adequada.

Descrição do parâmetro da API

  • modelo (string): nome do modelo (valor fixo), por exemplo tts-1
  • entrada (string): o texto a ser convertido, por exemplo "Olá, mundo!"
  • voz (string): nome da voz, por exemplo zh-CN-XiaoxiaoNeural
  • formato_de_resposta (string, opcional): formato de saída, o valor padrão é mp3
  • velocidade (número, opcional): taxa de fala (0,5-2,0), padrão 1.0
  • campo (número, opcional): tom (0,5-2,0), o padrão é 1.0
  • estilo (string, opcional): emoção, o padrão é geral

Lista de vozes compatíveis

Certifique-se de usar o texto do idioma correspondente à voz, por exemplo, a voz em chinês deve ser usada com o texto em chinês. Veja a seguir exemplos de vozes comumente usadas:

  • zh-CN-XiaoxiaoNeuralXiaoxiao - Caloroso e animado
  • zh-CN-XiaoyiNeuralXiaoyi - Calor e gentileza
  • zh-CN-YunxiNeuralYumshi - voz masculina, estável
  • zh-CN-YunyangNeuralYun Yang - voz masculina, profissional
  • zh-CN-XiaohanNeural: Xiaohan - Natural Flow
  • zh-CN-XiaomengNeuralXiaomeng - Doce e vibrante
  • zh-CN-XiaochenNeuralXiaochen - Gentil e fácil
  • Espere...
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Edge TTS Worker: implantação de APIs de síntese de fala da Microsoft usando Cloudflare, formato compatível com OpenAI e interface da Web empacotada

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil