Allgemeine Einführung
Weebo ist ein quelloffener Echtzeit-Sprach-Chatbot, der die Flüstern Small für die Spracherkennung, Llama 3.2 für die Erzeugung natürlicher Sprache und Kokoro-82M für die Sprachsynthese. Das von Amanvir Parhar entwickelte Projekt zielt darauf ab, eine effiziente Sprachdialoglösung bereitzustellen, die auf nativen Geräten läuft. Weebo unterstützt eine Vielzahl von Stimmen und generiert reibungslos Echtzeitantworten für eine Vielzahl von Anwendungsszenarien, die Sprachinteraktion erfordern.
Funktionsliste
- Spracherkennung in Echtzeit: Effiziente Sprache-zu-Text-Verarbeitung mit dem Whisper Small-Modell.
- Generierung natürlicher Sprache: Generierung von Antworten in natürlicher Sprache durch das Llama 3.2-Modell.
- Sprachsynthese: Umwandlung von Text in Sprache unter Verwendung des Kokoro-82M-Modells.
- Multi-Sound-Unterstützung: Bietet mehrere Sound-Optionen, um das Benutzererlebnis zu verbessern.
- Lokale Ausführung: Sie müssen sich nicht auf Cloud-Dienste verlassen, die gesamte Verarbeitung erfolgt auf dem lokalen Gerät.
- Offener Quellcode: Der Code ist öffentlich zugänglich, so dass die Nutzer die Funktionen frei ändern und erweitern können.
Hilfe verwenden
Ablauf der Installation
- Laden Sie das gewünschte Modell herunter:
- Kokoro-82M Modelldatei herunterladen
kokoro-v0_19.onnx
und in den Projektordner gelegt. - ausnutzen Ollama Das Werkzeug zieht das Llama 3.2 Modell.
- Kokoro-82M Modelldatei herunterladen
- Klonen Sie den Code des Weebo-Projekts:
git clone https://github.com/amanvirparhar/weebo.git
cd weebo
- Installieren Sie die Abhängigkeit:
pip install -r anforderungen.txt
- Führen Sie den Chatbot aus:
python main.py
Anweisungen für den Gebrauch
- Nach dem Start des Programms beginnt Weebo, auf Spracheingaben zu warten.
- Die Benutzer können ganz natürlich sprechen und Weebo erzeugt nach einer kurzen Pause eine Sprachantwort.
- Presse
Strg+C
Das Programm kann angehalten werden.
Hauptfunktionen
- SpracherkennungWeebo verwendet das Whisper Small-Modell für die Spracherkennung und ist in der Lage, die Sprache eines Benutzers genau in Text umzuwandeln.
- Erzeugung natürlicher SpracheMit Hilfe des Llama 3.2-Modells versteht Weebo die Spracheingabe des Benutzers und erzeugt eine natürlichsprachliche Antwort.
- SprachsyntheseMit dem Modell Kokoro-82M wandelt Weebo die generierte Textantwort in Sprache um und gibt sie über den Lautsprecher wieder.
- Multi-Voice-UnterstützungBenutzer können im Profil verschiedene Klangmodelle auswählen, um unterschiedliche Anwendungsanforderungen zu erfüllen.
Detaillierte Schritte
- Weebo starten: Lauf
python main.py
Das Programm beginnt, auf die Spracheingabe des Benutzers zu hören. - SpracheingabeBenutzer können direkt in das Mikrofon sprechen und Weebo wird die Stimme automatisch erkennen und verarbeiten.
- Generierung einer AntwortNach der Spracherkennung generiert Weebo eine natürlichsprachliche Antwort mit dem Llama 3.2-Modell und wandelt sie mit dem Kokoro-82M-Modell in Sprache um.
- Wiedergabe-AntwortDie generierte Sprachantwort wird über die Lautsprecher abgespielt und der Benutzer kann Weebos Antwort hören.
- AnhalteverfahrenPresse
Strg+C
Weebo kann jederzeit beendet werden.
Mit den oben genannten Schritten können Benutzer Weebo problemlos für Echtzeit-Sprachdialoge einsetzen und eine natürliche und reibungslose Sprachinteraktion erleben.