Allgemeine Einführung
Edge TTS Worker (Abhängigkeiten) edge-tts Edge TTS Worker ist ein auf Cloudflare Worker bereitgestellter Proxy-Dienst, der den Microsoft Edge TTS-Dienst in eine API-Schnittstelle kapselt, die mit dem OpenAI-Format kompatibel ist. Edge TTS Worker bietet Unterstützung für mehrere Sprachen, darunter Chinesisch, Englisch, Japanisch, Koreanisch usw., und ist völlig kostenlos, basierend auf dem Cloudflare Worker Free Plan. Der Dienst unterstützt auch benutzerdefinierte API-Schlüssel, um Sicherheit und Kontrolle zu gewährleisten, und kann innerhalb von Minuten bereitgestellt werden.
Ein Projekt zur Paketierung einer einfachen Schnittstelle für die API
Funktionsliste
- Bietet OpenAI-kompatible Schnittstellenformate
- Umgehung der Zugriffsbeschränkungen auf das Festland und Wegfall des Authentifizierungsschritts für Microsoft-Dienste
- Mehrsprachige Unterstützung, einschließlich Chinesisch, Englisch, Japanisch, Koreanisch usw.
- Völlig kostenlos, basierend auf Cloudflare Worker Free Plan
- Unterstützung für benutzerdefinierte API-Schlüssel zur Gewährleistung von Sicherheit und Kontrolle
- Schneller Einsatz, bereit in Minuten
- Bereitstellung von Testskripten zum Testen verschiedener Spracheffekte
Hilfe verwenden
Ablauf der Installation
- Erstellen eines Arbeiters
- Anmeldung bei Cloudflare Dashboard
- Gehen Sie zu Workers & Pages und klicken Sie auf Create Worker.
- Geben Sie dem Arbeiter einen Namen (z. B. edge-tts)
- Bereitstellungscode
- Entfernen Sie den Standardcode aus dem Editor
- eine Kopie machen von
worker.js
und fügen Sie den Code in das Feld - Klicken Sie auf Speichern und Bereitstellen
- Einstellen des API-Schlüssels (optional)
- Suchen Sie Einstellungen -> Variablen auf der Einstellungsseite des Workers.
- Klicken Sie auf Variable hinzufügen, geben Sie API_KEY als Namen und den Wert des gewünschten Schlüssels ein.
- Klicken Sie auf Speichern und Bereitstellen
- Konfigurieren Sie einen benutzerdefinierten Domänennamen (optional)
- Voraussetzungen: Ihre Domain wird bereits auf Cloudflare gehostet und die DNS-Einträge für die Domain wurden durch Cloudflare proxyiert (Proxy-Status ist orange Wolke)
- Schritte zur Konfiguration:
- Klicken Sie auf der Seite mit den Arbeitnehmerdetails auf die Registerkarte Einstellungen.
- Suchen Sie den Abschnitt Domäne und Routing und klicken Sie auf die Schaltfläche Hinzufügen.
- Wählen Sie Benutzerdefinierte Domäne und geben Sie den gewünschten Domänennamen ein (z. B. tts.example.com)
- Klicken Sie auf Domäne hinzufügen und warten Sie, bis die Zertifikatsbereitstellung abgeschlossen ist (in der Regel dauert es ein paar Minuten).
Verwendung
- TTY (Text-to-Speech-Schnittstelle)
- Beispiel für chinesische Sprache:
curl -X POST https://你的worker地址/v1/audio/speech \ -H "Content-Type: application/json" \\ -H "Authorization: Bearer your-api-key" \ -d '{ "model": "tts-1", "input": "Hallo". "input": "Hallo, Welt!" , "voice": "zh-CN-XiaoxiaoNeural", "speed": 1.0, "response_format". "Stellplatz": 1.0, "style": "general" }' --output chinese.mp3
- Beispiel für englische Sprache:
curl -X POST https://你的worker地址/v1/audio/speech \ -H "Content-Type: application/json" \\ -H "Authorization: Bearer your-api-key" \ -d '{ "model": "tts-1", "input": "Hallo Welt". "input": "Hallo, Welt!", "voice": "en-US". "Stimme": "en-US-JennyNeural", "Tonhöhe": 1.0, "Stil": "allgemein". "style": "general" }' --output english.mp3
- Verwendung des Testskripts
- Testskript herunterladen
test_Stimmen.sh
- Fügen Sie dem Skript Ausführungsberechtigungen hinzu:
bash
chmod +x test_voices.sh
- Führen Sie das Skript aus:
bash
. /test_voices.sh [API-Schlüssel].
- Beispiel:
bash
# API-Schlüssel verwenden
. /test_voices.sh https://your-worker.workers.dev ihr-api-schlüssel
# verwendet keinen API-Schlüssel
. /test_voices.sh https://your-worker.workers.dev
- Das Skript erzeugt Test-Audiodateien für jede unterstützte Stimme, die Sie abspielen können, um die am besten geeignete Stimme auszuwählen.
- Testskript herunterladen
API-Parameter Beschreibung
Modell
(string): Modellname (fester Wert), z. B.tts-1
Eingabe
(string): der zu konvertierende Text, z. B."Hallo, Welt!"
Stimme
(string): Name der Stimme, z. B.zh-CN-XiaoxiaoNeural
response_format
(string, optional): Ausgabeformat, Standardwert istmp3
Geschwindigkeit
(Zahl, optional): Sprechgeschwindigkeit (0,5-2,0), Standardwert ist1.0
Stellplatz
(Zahl, optional): Ton (0,5-2,0), Standardwert ist1.0
Stil
(string, optional): Emotion, Standardwert istallgemein
Liste der unterstützten Stimmen
Bitte stellen Sie sicher, dass Sie den Text in der Sprache verwenden, die der Stimme entspricht, z. B. sollte die chinesische Stimme mit dem chinesischen Text verwendet werden. Im Folgenden finden Sie Beispiele für häufig verwendete Stimmen:
zh-CN-XiaoxiaoNeural
Xiaoxiao - Warm und lebendigzh-CN-XiaoyiNeural
Xiaoyi - Herzlichkeit und Freundlichkeitzh-CN-YunxiNeural
:: Yumshi - männliche Stimme, konstantzh-CN-YunyangNeural
:: Yun Yang - männliche Stimme, professionellzh-CN-XiaohanNeural
Xiaohan - Natürlicher Flusszh-CN-XiaomengNeural
Xiaomeng - Süß und lebendigzh-CN-XiaochenNeural
Xiaochen - Sanft und leicht- Warten Sie...