AI Personal Learning
und praktische Anleitung

Edge TTS Worker: Einsatz von Microsoft Speech Synthesis APIs mit Cloudflare, OpenAI-kompatiblem Format und Packaged Web Interface

Allgemeine Einführung

Edge TTS Worker (Abhängigkeiten) edge-tts Edge TTS Worker ist ein auf Cloudflare Worker bereitgestellter Proxy-Dienst, der den Microsoft Edge TTS-Dienst in eine API-Schnittstelle kapselt, die mit dem OpenAI-Format kompatibel ist. Edge TTS Worker bietet Unterstützung für mehrere Sprachen, darunter Chinesisch, Englisch, Japanisch, Koreanisch usw., und ist völlig kostenlos, basierend auf dem Cloudflare Worker Free Plan. Der Dienst unterstützt auch benutzerdefinierte API-Schlüssel, um Sicherheit und Kontrolle zu gewährleisten, und kann innerhalb von Minuten bereitgestellt werden.

Ein Projekt zur Paketierung einer einfachen Schnittstelle für die API


Edge TTS Worker: Bereitstellung von Microsoft Speech Synthesis API mit Cloudflare, kompatibel mit OpenAI Format und Packaging Web Interface-1

 

Funktionsliste

  • Bietet OpenAI-kompatible Schnittstellenformate
  • Umgehung der Zugriffsbeschränkungen auf das Festland und Wegfall des Authentifizierungsschritts für Microsoft-Dienste
  • Mehrsprachige Unterstützung, einschließlich Chinesisch, Englisch, Japanisch, Koreanisch usw.
  • Völlig kostenlos, basierend auf Cloudflare Worker Free Plan
  • Unterstützung für benutzerdefinierte API-Schlüssel zur Gewährleistung von Sicherheit und Kontrolle
  • Schneller Einsatz, bereit in Minuten
  • Bereitstellung von Testskripten zum Testen verschiedener Spracheffekte

 

Hilfe verwenden

Ablauf der Installation

  1. Erstellen eines Arbeiters
    • Anmeldung bei Cloudflare Dashboard
    • Gehen Sie zu Workers & Pages und klicken Sie auf Create Worker.
    • Geben Sie dem Arbeiter einen Namen (z. B. edge-tts)
  2. Bereitstellungscode
    • Entfernen Sie den Standardcode aus dem Editor
    • eine Kopie machen von worker.js und fügen Sie den Code in das Feld
    • Klicken Sie auf Speichern und Bereitstellen
  3. Einstellen des API-Schlüssels (optional)
    • Suchen Sie Einstellungen -> Variablen auf der Einstellungsseite des Workers.
    • Klicken Sie auf Variable hinzufügen, geben Sie API_KEY als Namen und den Wert des gewünschten Schlüssels ein.
    • Klicken Sie auf Speichern und Bereitstellen
  4. Konfigurieren Sie einen benutzerdefinierten Domänennamen (optional)
    • Voraussetzungen: Ihre Domain wird bereits auf Cloudflare gehostet und die DNS-Einträge für die Domain wurden durch Cloudflare proxyiert (Proxy-Status ist orange Wolke)
    • Schritte zur Konfiguration:
      • Klicken Sie auf der Seite mit den Arbeitnehmerdetails auf die Registerkarte Einstellungen.
      • Suchen Sie den Abschnitt Domäne und Routing und klicken Sie auf die Schaltfläche Hinzufügen.
      • Wählen Sie Benutzerdefinierte Domäne und geben Sie den gewünschten Domänennamen ein (z. B. tts.example.com)
      • Klicken Sie auf Domäne hinzufügen und warten Sie, bis die Zertifikatsbereitstellung abgeschlossen ist (in der Regel dauert es ein paar Minuten).

Verwendung

  1. TTY (Text-to-Speech-Schnittstelle)
    • Beispiel für chinesische Sprache:
     curl -X POST https://你的worker地址/v1/audio/speech \
    -H "Content-Type: application/json" \\
    -H "Authorization: Bearer your-api-key" \
    -d '{
    "model": "tts-1", "input": "Hallo".
    "input": "Hallo, Welt!" ,
    "voice": "zh-CN-XiaoxiaoNeural",
    
    "speed": 1.0, "response_format".
    "Stellplatz": 1.0,
    "style": "general"
    }' --output chinese.mp3
    
    • Beispiel für englische Sprache:
     curl -X POST https://你的worker地址/v1/audio/speech \
    -H "Content-Type: application/json" \\
    -H "Authorization: Bearer your-api-key" \
    -d '{
    "model": "tts-1", "input": "Hallo Welt".
    "input": "Hallo, Welt!", "voice": "en-US".
    "Stimme": "en-US-JennyNeural",
    
    
    "Tonhöhe": 1.0, "Stil": "allgemein".
    "style": "general"
    }' --output english.mp3
    
  2. Verwendung des Testskripts
    • Testskript herunterladen test_Stimmen.sh
    • Fügen Sie dem Skript Ausführungsberechtigungen hinzu: bash
      chmod +x test_voices.sh
    • Führen Sie das Skript aus: bash
      . /test_voices.sh [API-Schlüssel].
    • Beispiel: bash
      # API-Schlüssel verwenden
      . /test_voices.sh https://your-worker.workers.dev ihr-api-schlüssel
      # verwendet keinen API-Schlüssel
      . /test_voices.sh https://your-worker.workers.dev
    • Das Skript erzeugt Test-Audiodateien für jede unterstützte Stimme, die Sie abspielen können, um die am besten geeignete Stimme auszuwählen.

API-Parameter Beschreibung

  • Modell (string): Modellname (fester Wert), z. B. tts-1
  • Eingabe (string): der zu konvertierende Text, z. B. "Hallo, Welt!"
  • Stimme (string): Name der Stimme, z. B. zh-CN-XiaoxiaoNeural
  • response_format (string, optional): Ausgabeformat, Standardwert ist mp3
  • Geschwindigkeit (Zahl, optional): Sprechgeschwindigkeit (0,5-2,0), Standardwert ist 1.0
  • Stellplatz (Zahl, optional): Ton (0,5-2,0), Standardwert ist 1.0
  • Stil (string, optional): Emotion, Standardwert ist allgemein

Liste der unterstützten Stimmen

Bitte stellen Sie sicher, dass Sie den Text in der Sprache verwenden, die der Stimme entspricht, z. B. sollte die chinesische Stimme mit dem chinesischen Text verwendet werden. Im Folgenden finden Sie Beispiele für häufig verwendete Stimmen:

  • zh-CN-XiaoxiaoNeuralXiaoxiao - Warm und lebendig
  • zh-CN-XiaoyiNeuralXiaoyi - Herzlichkeit und Freundlichkeit
  • zh-CN-YunxiNeural:: Yumshi - männliche Stimme, konstant
  • zh-CN-YunyangNeural:: Yun Yang - männliche Stimme, professionell
  • zh-CN-XiaohanNeuralXiaohan - Natürlicher Fluss
  • zh-CN-XiaomengNeuralXiaomeng - Süß und lebendig
  • zh-CN-XiaochenNeuralXiaochen - Sanft und leicht
  • Warten Sie...
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Edge TTS Worker: Einsatz von Microsoft Speech Synthesis APIs mit Cloudflare, OpenAI-kompatiblem Format und Packaged Web Interface

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)