Weebo: ein Echtzeit-Sprach-Chatbot, der einen Dialog in natürlicher Sprache ermöglicht

Neueste AI-RessourcenGeschrieben vor 7 Monaten AI-Austauschkreis

2.7K 00

Allgemeine Einführung

Weebo ist ein quelloffener Echtzeit-Sprach-Chatbot, der die Flüstern Small für die Spracherkennung, Llama 3.2 für die Erzeugung natürlicher Sprache und Kokoro-82M für die Sprachsynthese. Das von Amanvir Parhar entwickelte Projekt zielt darauf ab, eine effiziente Sprachdialoglösung bereitzustellen, die auf nativen Geräten läuft. Weebo unterstützt eine Vielzahl von Stimmen und generiert reibungslos Echtzeitantworten für eine Vielzahl von Anwendungsszenarien, die Sprachinteraktion erfordern.

Funktionsliste

Spracherkennung in Echtzeit: Effiziente Sprache-zu-Text-Verarbeitung mit dem Whisper Small-Modell.
Generierung natürlicher Sprache: Generierung von Antworten in natürlicher Sprache durch das Llama 3.2-Modell.
Sprachsynthese: Umwandlung von Text in Sprache unter Verwendung des Kokoro-82M-Modells.
Multi-Sound-Unterstützung: Bietet mehrere Sound-Optionen, um das Benutzererlebnis zu verbessern.
Lokale Ausführung: Sie müssen sich nicht auf Cloud-Dienste verlassen, die gesamte Verarbeitung erfolgt auf dem lokalen Gerät.
Offener Quellcode: Der Code ist öffentlich zugänglich, so dass die Nutzer die Funktionen frei ändern und erweitern können.

Hilfe verwenden

Einbauverfahren

Laden Sie das gewünschte Modell herunter:
- Kokoro-82M Modelldatei herunterladen kokoro-v0_19.onnx und in den Projektordner gelegt.
- ausnutzen Ollama Das Werkzeug zieht das Llama 3.2 Modell.
Klonen Sie den Code des Weebo-Projekts:

   git clone https://github.com/amanvirparhar/weebo.git
cd weebo

Installieren Sie die Abhängigkeit:

   pip install -r requirements.txt

Führen Sie den Chatbot aus:

   python main.py

Anweisungen für den Gebrauch

Nach dem Start des Programms beginnt Weebo, auf Spracheingaben zu warten.
Die Benutzer können ganz natürlich sprechen und Weebo erzeugt nach einer kurzen Pause eine Sprachantwort.
drücken. Ctrl+C Das Programm kann angehalten werden.

Hauptfunktionen

SpracherkennungWeebo verwendet das Whisper Small-Modell für die Spracherkennung und ist in der Lage, die Sprache eines Benutzers genau in Text umzuwandeln.
Erzeugung natürlicher SpracheMit Hilfe des Llama 3.2-Modells versteht Weebo die Spracheingabe des Benutzers und erzeugt eine natürlichsprachliche Antwort.
SprachsyntheseMit dem Modell Kokoro-82M wandelt Weebo die generierte Textantwort in Sprache um und gibt sie über den Lautsprecher wieder.
Multi-Voice-UnterstützungBenutzer können im Profil verschiedene Klangmodelle auswählen, um unterschiedliche Anwendungsanforderungen zu erfüllen.

Detaillierte Schritte

Weebo starten: Lauf python main.pyDas Programm beginnt, auf die Spracheingabe des Benutzers zu hören.
SpracheingabeBenutzer können direkt in das Mikrofon sprechen und Weebo wird die Stimme automatisch erkennen und verarbeiten.
Generierung einer AntwortNach der Spracherkennung generiert Weebo eine natürlichsprachliche Antwort mit dem Llama 3.2-Modell und wandelt sie mit dem Kokoro-82M-Modell in Sprache um.
Wiedergabe-AntwortDie generierte Sprachantwort wird über die Lautsprecher abgespielt und der Benutzer kann Weebos Antwort hören.
AnhalteverfahrenPresse Ctrl+C Weebo kann jederzeit beendet werden.

Mit den oben genannten Schritten können Benutzer Weebo problemlos für Echtzeit-Sprachdialoge einsetzen und eine natürliche und reibungslose Sprachinteraktion erleben.