AI Personal Learning
und praktische Anleitung
豆包Marscode1

Linly-Talker: Intelligentes Dialogsystem für digitale Menschen, das große Sprachmodelle und visuelle Modelle für neue interaktive Erlebnisse kombiniert

Allgemeine Einführung

Linly-Talker ist ein innovatives digitales Dialogsystem, das Large Language Models (LLMs) mit visuellen Modellen kombiniert, um einen neuen Ansatz für die Interaktion zwischen Mensch und Computer zu schaffen. Das System integriert mehrere Technologien wie Whisper, Linly, Microsoft Speech Services und SadTalker Linly-Talker unterstützt Benutzer beim Hochladen von Bildern für Dialoge und verbessert die Interaktivität und den Realismus durch ein Mehrrunden-Dialogsystem. Das Projekt wurde von Kedreamix entwickelt und steht Entwicklern und Forschern auf GitHub zur Nutzung und Verbesserung zur Verfügung.

Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验-1


 

Funktionsliste

  • Mehrrunden-DialogsystemUnterstützt kontextabhängige Dialoge mit mehreren Runden für mehr Interaktivität und Realismus.
  • Dialog zum Hochladen von BildernNutzer können Bilder hochladen und mit digitalen Menschen in einen Dialog treten.
  • Sprachsynthese und -erkennungIntegriert mit Microsoft TTS und FunASR, um mehrere Sprachtypen und eine schnelle Spracherkennung zu ermöglichen.
  • Erzeugung von VideountertitelnUnterstützt die Erzeugung von Videountertiteln für verbesserte visuelle Effekte.
  • SprachklonenMit dem Modell GPT-SoVITS können Stimmen mit einer Minute Sprachdaten geklont werden.
  • Personalisierte CharaktererstellungUnterstützung der personalisierten Rollenerstellung mit mehreren Modellen und Optionen.
  • Echtzeit-DialogIntegration mit MuseTalk für grundlegende Echtzeit-Dialogfunktionen.

 

Hilfe verwenden

Einbauverfahren

  1. Klonprojekt: Führen Sie den folgenden Befehl im Terminal aus, um das Projekt zu klonen:
复制复制复制复制
复制
   git clone https://github.com/Kedreamix/Linly-Talker.git
  1. Installation von Abhängigkeiten: Wechseln Sie in das Projektverzeichnis und installieren Sie die erforderlichen Abhängigkeiten:
复制复制复制
复制
   cd Linly-Talker
pip install -r requirements_app.txt
pip install -r requirements_webui.txt
  1. Konfiguration der UmgebungKonfigurieren Sie die Umgebungsvariablen und Zertifikate nach Bedarf, um den ordnungsgemäßen Betrieb des Systems sicherzustellen.

Leitlinien für die Verwendung

  1. Starten der WebUIFühren Sie den folgenden Befehl aus, um die WebUI zu starten:
复制复制
复制
   python webui.py

Öffnen Sie Ihren Browser, um auf http://localhost:7860Wenn Sie auf die Weboberfläche von Linly-Talker zugreifen möchten, können Sie dies tun, indem Sie auf den folgenden Link klicken.

  1. Bilder für den Dialog hochladen::
    • Klicken Sie in der WebUI-Oberfläche auf die Schaltfläche "Bild hochladen" und wählen Sie die hochzuladende Bilddatei aus.
    • Sobald das Bild hochgeladen ist, generiert das System automatisch Dialoginhalte und der Benutzer kann mit der digitalen Person interagieren.
  2. Sprachsynthese und -erkennung::
    • Geben Sie den Text in das Dialogfeld ein, wählen Sie den Sprachtyp aus, klicken Sie auf die Schaltfläche "Stimme erzeugen", das System synthetisiert die Stimme und spielt sie ab.
    • Die Benutzer können auch ihre Stimme über das Mikrofon eingeben, und das System erkennt und generiert automatisch Text.
  3. Erzeugung von Videountertiteln::
    • Laden Sie eine Videodatei hoch, das System generiert automatisch Untertitel und bettet sie in das Video ein, und die Benutzer können die Videodatei mit Untertiteln herunterladen.
  4. Sprachklonen::
    • Laden Sie eine Stimmprobe der Zielperson hoch, und das System verwendet das GPT-SoVITS-Modell zum Klonen der Stimme, um eine der Zielperson ähnliche Stimme zu erzeugen.
  5. Personalisierte Charaktererstellung::
    • Wählen Sie in der WebUI-Oberfläche die Option "Personalisierte Persona-Generierung", geben Sie die Persona-Informationen ein, und das System wird eine personalisierte Persona generieren.
  6. Echtzeit-Dialog::
    • Wenn Sie das MuseTalk-Modul auswählen, schaltet das System die Echtzeit-Dialogfunktion ein, die es dem Benutzer ermöglicht, mit der digitalen Person in Echtzeit zu interagieren.

 

Windows-Komplett-Installationsprogramm

首席AI分享圈Dieser Inhalt wurde vom Autor versteckt, bitte geben Sie den Verifizierungscode ein, um den Inhalt zu sehen
Captcha:
Bitte achten Sie auf diese Website WeChat öffentliche Nummer, Antwort "CAPTCHA, eine Art von Challenge-Response-Test (Computertechnik)", um den Verifizierungscode zu erhalten. Suchen Sie in WeChat nach "Leiter des AI-Austauschkreises"oder"Looks-AI" oder WeChat Scannen der rechten Seite des QR-Codes kann die Aufmerksamkeit auf diese Website WeChat öffentliche Zahl zu zahlen.

Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " Linly-Talker: Intelligentes Dialogsystem für digitale Menschen, das große Sprachmodelle und visuelle Modelle für neue interaktive Erlebnisse kombiniert
de_DEDeutsch