Allgemeine Einführung
Kokoro-ONNX ist ein quelloffenes Text-to-Speech (TTS)-Tool, das auf der ONNX-Laufzeitumgebung basiert. Entwickelt von thewh1teagle, zielt das Projekt darauf ab, eine effiziente und schnelle Sprachsyntheselösung zu bieten. Kokoro-ONNX unterstützt mehrere Sprachen, darunter Englisch, und plant die Unterstützung von Französisch, Japanisch, Koreanisch und Chinesisch. Das Tool bietet eine große Auswahl an Stimmen, einschließlich eines Flüstermodus, und verfügt über eine hervorragende Leistung, die unter macOS M1 nahezu in Echtzeit abläuft. Das leichtgewichtige Design von kokoro-ONNX macht es einfach zu installieren und zu verwenden, wodurch es für Entwickler und Forscher geeignet ist, die eine effiziente TTS-Lösung benötigen.
Funktionsliste
- Unterstützung von Text-to-Speech (TTS) für mehrere Sprachen
- Mehrere Sprachoptionen, einschließlich Flüstermodus
- Effiziente Leistung, nahezu Echtzeitbetrieb
- Leichtes Design, Installationspaket ca. 300MB (ca. 80MB nach Quantisierung)
- Kompatibel mit macOS M1
- Offener Quellcode, basierend auf MIT- und Apache 2.0-Lizenzen
Hilfe verwenden
Ablauf der Installation
- Öffnen Sie ein Terminal (PowerShell / Bash).
- Führen Sie den folgenden Befehl aus, um Kokoro-ONNX zu installieren:
pip install -U kokoro-onnx
- Laden Sie die erforderlichen Dokumente herunter
kokoro-v0_19.onnx
im Gesang antwortenStimmen.json
und legen Sie sie in dasselbe Verzeichnis.
Verwendung
- Führen Sie den folgenden Befehl in einem Terminal aus, um Kokoro-ONNX zu starten:
uv init -p 3.12
uv add kokoro-onnx soundfile
- Oberbefehlshaber (Militär)
Beispiele/save.py
Fügen Sie den Inhalt der Dateihallo.py
Mitte. - Datei herunterladen
kokoro-v0_19.onnx
im Gesang antwortenStimmen.json
und legen Sie sie in dasselbe Verzeichnis. - Führen Sie den folgenden Befehl aus, um Sprache zu erzeugen:
python hallo.py
Funktion Betriebsablauf
- Sprache und Stimme auswählen: in
Stimmen.json
Wählen Sie die gewünschte Sprache und Stimme aus der Liste - Eingabetext: in
hallo.py
Geben Sie den Text, der in Sprache umgewandelt werden soll, im Feld - Sprache generierenNach der Ausführung des Skripts wird die erzeugte Sprachdatei in dem angegebenen Verzeichnis gespeichert.
Ausgewählte Funktionen
- Mehrsprachige UnterstützungKokoro-ONNX unterstützt derzeit Englisch und plant, weitere Sprachen wie Französisch, Japanisch, Koreanisch und Chinesisch zu unterstützen.
- Mehrere SoundoptionenBenutzer können verschiedene Stimmen auswählen, einschließlich des Flüstermodus, um den Anforderungen verschiedener Szenarien gerecht zu werden.
- Hohe LeistungLäuft nahezu in Echtzeit auf macOS M1 für Anwendungsszenarien, die eine schnelle Reaktion erfordern.
- Leichte KonstruktionDie geringe Größe des Installationspakets macht es einfach, es schnell einzusetzen und zu verwenden.
Mit diesen Schritten können die Benutzer Kokoro-ONNX einfach installieren und für eine effiziente Text-to-Speech-Funktionalität nutzen. Detaillierte Bedienungsanleitungen und ausführliche Funktionsbeschreibungen sorgen dafür, dass die Benutzer schnell loslegen und die Vorteile des Tools voll ausschöpfen können.