AI Personal Learning
und praktische Anleitung
Sitzsack Marscode1

ElevenLabs MCP: MCP-Dienst der Spracherzeugung

Allgemeine Einführung

ElevenLabs MCP ElevenLabs ist ein offizielles Open-Source-Projekt, das auf GitHub gehostet wird. Es handelt sich um ein Server-Tool, das auf dem Model Context Protocol (MCP) basiert und dazu dient, KI-Modelle mit den Sprach- und Audioverarbeitungsfunktionen von ElevenLabs zu verbinden. Das Tool ermöglicht es Benutzern, Text in natürliche Sprache umzuwandeln, personalisierte Stimmen zu klonen, Audio zu transkribieren und sogar konversationelle KI-Agenten zu erstellen. Es unterstützt die Zusammenarbeit mit Claude Client-Integrationen wie Desktop, Cursor, Windsurf und andere ermöglichen es Entwicklern, Server lokal zu betreiben und Audioaufgaben über die cloudbasierte API von ElevenLabs zu verarbeiten. Die kostenlose Version des Projekts bietet 10.000 Credits pro Monat für persönliche Tests, während der kostenpflichtige Plan die Nutzung in größerem Umfang unterstützt.

ElevenLabs MCP: Spracherzeugung MCP Service-1


 

Funktionsliste

  • Text-to-SpeechVerwandeln Sie Wörter in flüssige und natürliche Sprache und unterstützen Sie dabei eine Vielzahl von Tönen und Sprachen.
  • SprachklonenGenerierung einzigartiger AI-Sounds aus Audiosamples.
  • Sprache-zu-TextKonvertierung von Audiodateien in Text mit Unterstützung für die Erkennung von mehreren Sprechern.
  • Dialog KI:: Schaffung intelligenter Agenten, die per Sprache kommunizieren können und für ausgehende Anrufe usw. eingesetzt werden können.
  • AudioverarbeitungBietet nützliche Funktionen wie Schallisolierung und Verbesserung der Klangqualität.
  • Lokale Server-UnterstützungAusführen eines Servers auf dem Gerät des Benutzers zur Verbindung mit der Cloud-API.

 

Hilfe verwenden

Einbauverfahren

Um ElevenLabs MCP zu verwenden, müssen Sie den Server lokal installieren und konfigurieren. Nachfolgend finden Sie die detaillierten Schritte:

  1. Vorbereiten der Umgebung
    • Stellen Sie sicher, dass Python 3.8 oder höher auf Ihrem Computer installiert ist. Verwenden Sie den Befehl python --version Überprüfen Sie die Version.
    • ElevenLabs API-Schlüssel erhalten. Zugang Offizielle Website von ElevenLabsNach der Registrierung finden Sie den Schlüssel auf der Seite Einstellungen.
    • Empfohlene Installation uv(Python-Paketmanager). Verwenden Sie den Befehl curl -LsSf https://astral.sh/uv/install.sh | sh Installation, oder siehe uv-Lagerhaus.
  2. Projekt herunterladen
    • Öffnen Sie ein Terminal und geben Sie ein:
      git clone https://github.com/elevenlabs/elevenlabs-mcp.git
      cd elevenlabs-mcp
      
  3. Installation von Abhängigkeiten
    • Kosten oder Aufwand uv Einbau:
      uv pip install -r requirements.txt
      
    • oder mit der Standardeinstellung pip::
      pip install -r requirements.txt
      
  4. API-Schlüssel konfigurieren
    • Methode 1: Geben Sie den Schlüssel zur Laufzeit ein:
      python -m elevenlabs_mcp --api-key=你的API密钥
      
    • Methode 2: Setzen von Umgebungsvariablen. Geben Sie in das Terminal ein:
      export ELEVENLABS_API_KEY=你的API密钥
      

      Dann laufen Sie:

      python -m elevenlabs_mcp
      
  5. Starten Sie den Server
    • Die Standardadresse lautet http://127.0.0.1:8000. Wenn es einen Portkonflikt gibt, verwenden Sie die --port Modifizierung:
      python -m elevenlabs_mcp --port=8080
      
  6. Kunden verbinden
    • Claude Schreibtisch
      • Öffnen Sie Claude Desktop und klicken Sie auf Menü > Hilfe > Entwicklermodus aktivieren in der oberen linken Ecke (Windows-Benutzer müssen ihn aktivieren).
      • Gehen Sie zu Einstellungen > Entwickler > Konfig. bearbeiten, um eine Konfiguration hinzuzufügen:
        {
        "mcpServers": {
        "ElevenLabs": {
        "command": "uvx",
        "args": ["elevenlabs-mcp"],
        "env": {
        "ELEVENLABS_API_KEY": "你的API密钥"
        }
        }
        }
        }
        
      • Speichern Sie und starten Sie Claude neu.
    • Andere Kunden (z. B. Cursor, Windsurf)
      • Installieren Sie das Paket:
        pip install elevenlabs-mcp
        
      • Führen Sie es aus und erhalten Sie die Konfiguration:
        python -m elevenlabs_mcp --api-key=你的API密钥 --print
        
      • Fügen Sie die Ausgabekonfiguration in das angegebene Verzeichnis auf dem Client ein.

Funktion Betriebsablauf

Text-to-Speech

  • Geben Sie in Claude ein: "Erzeugen Sie mit ElevenLabs eine Rede: 'Hallo, ich bin ElevenLabs'."
  • Server erzeugt Audio und gibt es zurück, Claude spielt es automatisch ab. Es können Töne angegeben werden, z. B. "Stimme: Adam".

Sprachklonen

  • Bereiten Sie 2-3 klare Hörproben vor (z. B. sample.wav).
  • Geben Sie ein: "Eine Stimme mit [sample.wav] klonen".
  • Der Server gibt eine Sprach-ID zurück, die zur Erzeugung einer neuen Stimme verwendet wird.

Sprache-zu-Text

  • Laden Sie eine Audiodatei hoch (z. B. audio.mp3).
  • Geben Sie ein: "Audio transkribieren: audio.mp3 mit ElevenLabs".
  • Gibt den transkribierten Text zurück und erkennt verschiedene Sprecher, wenn es mehrere Sprecher gibt.

Dialog KI

  • Geben Sie ein: "Erstellen Sie einen KI-Agenten, der wie ein Detektiv spricht und Filmfragen beantwortet".
  • Der Server erzeugt Agenten mit Sprache, mit denen über Text oder Sprache interagiert werden kann.

Audioverarbeitung

  • Eingabe: "Stimme von Hintergrundgeräuschen in audio.mp3 isolieren".
  • Gibt die verarbeitete Audiodatei zurück.

Fehlersuche und Protokollierung

  • Standort protokollieren:
    • Fenster. %APPDATA%\Claude\logs\mcp-server-elevenlabs.log
    • macOS. ~/Library/Logs/Claude/mcp-server-elevenlabs.log
  • Timeout-Probleme: Vorgänge, wie z. B. das Entwerfen von Stimmen, sind zeitaufwändig und können im Entwicklungsmodus zu einer Zeitüberschreitung führen, aber die Aufgabe wird trotzdem abgeschlossen.

Allgemeine Fehlerbehebung

  • "uvx ENOENT laichen".
    • Sonde uvx Pfad:
      which uvx
      
    • Aktualisieren Sie die Konfiguration, z. B. "command": "/usr/local/bin/uvx".

 

Anwendungsszenario

  1. Erstellung von Inhalten
    • Podcast-Produzenten verwenden Text-to-Speech, um einen Kommentar zu erstellen, oder klonen ihre eigenen Stimmen, um Audio in Massen zu produzieren.
  2. Bildung und Ausbildung
    • Lehrer wandeln Lektionstext in Sprache um, um Audio-Lernmaterial zu erstellen.
  3. Kundenbetreuung
    • Unternehmen nutzen konversationelle KI, um einen sprachgesteuerten Kundendienst zu schaffen, der häufig gestellte Anfragen bearbeitet.
  4. Spieleentwicklung
    • Die Entwickler erzeugen einzigartige Stimmen für die Charaktere, um die Immersion zu erhöhen.

 

QA

  1. Muss ich bezahlen?
    • Die kostenlose Stufe bietet 10.000 Punkte/Monat, darüber hinaus müssen Sie einen kostenpflichtigen Plan erwerben.
  2. Welche Sprachen werden unterstützt?
    • Unterstützt Englisch, Chinesisch und andere Sprachen, siehe ElevenLabs offizielle Website.
  3. Wie überprüfe ich die Nutzung?
    • Loggen Sie sich auf der ElevenLabs-Website ein und sehen Sie den Punktverbrauch auf Ihrer Kontoseite.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " ElevenLabs MCP: MCP-Dienst der Spracherzeugung
de_DEDeutsch