ElevenLabs MCP : Service MCP de génération de discours
Introduction générale
ElevenLabsMCP ElevenLabs est un projet open source officiel hébergé sur GitHub. Il s'agit d'un outil serveur basé sur le Model Context Protocol (MCP) conçu pour connecter les modèles d'IA aux capacités de traitement de la parole et de l'audio d'ElevenLabs. L'outil permet aux utilisateurs de convertir du texte en parole naturelle, de cloner des voix personnalisées, de transcrire de l'audio et même de créer des agents d'IA conversationnels. Il prend en charge la collaboration avec Claude Les intégrations de clients tels que Desktop, Cursor, Windsurf et d'autres permettent aux développeurs d'exécuter des serveurs localement et de traiter des tâches audio par le biais de l'API d'ElevenLabs basée sur le nuage. La version gratuite du projet offre 10 000 crédits par mois pour des tests personnels, tandis que la version payante permet une utilisation à plus grande échelle.

Liste des fonctions
- synthèse vocaleLes logiciels de reconnaissance vocale : Transformez un texte en une parole fluide et naturelle, en prenant en charge un large éventail de tonalités et de langues.
- clonage de la paroleLes sons de l'IA : Générer des sons d'IA uniques à partir d'échantillons audio.
- de la parole au texte: : Convertir des fichiers audio en texte avec prise en charge de la reconnaissance de plusieurs locuteurs.
- Dialogue AI: : Créer des agents intelligents qui peuvent communiquer par la voix et qui peuvent être utilisés pour les appels sortants, etc.
- traitement audioLe système d'isolation phonique : Il offre des fonctions utiles telles que l'isolation phonique et l'amélioration de la qualité du son.
- Soutien au serveur localL'API : Exécute un serveur sur l'appareil de l'utilisateur pour se connecter à l'API dans le nuage.
Utiliser l'aide
Processus d'installation
Pour utiliser ElevenLabs MCP, vous devez installer et configurer le serveur localement. Vous trouverez ci-dessous les étapes détaillées :
- Préparation de l'environnement
- Assurez-vous que Python 3.8 ou une version ultérieure est installé sur votre ordinateur. Utilisez la commande
python --version
Vérifier la version. - Obtenir la clé API de ElevenLabs. Accès Site officiel d'ElevenLabsAprès l'enregistrement, la clé se trouve sur la page Paramètres.
- Installation recommandée
uv
(Python Package Manager). Utilisez la commandecurl -LsSf https://astral.sh/uv/install.sh | sh
Installation, ou se référer à Entrepôt uv.
- Assurez-vous que Python 3.8 ou une version ultérieure est installé sur votre ordinateur. Utilisez la commande
- Télécharger le projet
- Ouvrez un terminal et tapez
git clone https://github.com/elevenlabs/elevenlabs-mcp.git cd elevenlabs-mcp
- Ouvrez un terminal et tapez
- Installation des dépendances
- dépense ou frais
uv
Installation :uv pip install -r requirements.txt
- ou avec l'option par défaut
pip
: :pip install -r requirements.txt
- dépense ou frais
- Configuration des clés API
- Méthode 1 : Saisir la clé au moment de l'exécution :
python -m elevenlabs_mcp --api-key=你的API密钥
- Méthode 2 : Définition des variables d'environnement. Tapez dans le terminal :
export ELEVENLABS_API_KEY=你的API密钥
Ensuite, courez :
python -m elevenlabs_mcp
- Méthode 1 : Saisir la clé au moment de l'exécution :
- Démarrer le serveur
- L'adresse par défaut est
http://127.0.0.1:8000
. En cas de conflit de port, utilisez la fonction--port
Modification :python -m elevenlabs_mcp --port=8080
- L'adresse par défaut est
- Connecter les clients
- Bureau de Claude
- Ouvrez Claude Desktop et cliquez sur Menu > Aide > Activer le mode développeur dans le coin supérieur gauche (les utilisateurs de Windows doivent l'activer).
- Allez dans Réglages > Développeur > Modifier la configuration pour ajouter une configuration :
{ "mcpServers": { "ElevenLabs": { "command": "uvx", "args": ["elevenlabs-mcp"], "env": { "ELEVENLABS_API_KEY": "你的API密钥" } } } }
- Sauvegardez et redémarrez Claude.
- Autres clients (par exemple, Cursor, Windsurf)
- Installer le paquet :
pip install elevenlabs-mcp
- Exécutez-le et obtenez la configuration :
python -m elevenlabs_mcp --api-key=你的API密钥 --print
- Coller la configuration de sortie dans le répertoire spécifié sur le client.
- Installer le paquet :
- Bureau de Claude
Fonction Opération Déroulement
synthèse vocale
- Tapez dans Claude : "Generate speech : 'Hello, I'm ElevenLabs' with ElevenLabs".
- Le serveur génère de l'audio et le renvoie, Claude le joue automatiquement. Des tonalités peuvent être spécifiées, par exemple "voix : Adam".
clonage de la parole
- Préparez 2 à 3 échantillons audio clairs (par ex.
sample.wav
). - Entrer : "Cloner une voix avec [sample.wav]".
- Le serveur renvoie un identifiant vocal, qui est utilisé pour générer une nouvelle voix.
de la parole au texte
- Télécharger un fichier audio (par ex.
audio.mp3
). - Tapez, "Transcrire l'audio : audio.mp3 avec ElevenLabs".
- Renvoie le texte transcrit et reconnaît les différents locuteurs s'il y en a plusieurs.
Dialogue AI
- Entrée : "Créer un agent d'intelligence artificielle qui parle comme un détective et répond à des questions sur le cinéma".
- Le serveur génère des agents vocaux avec lesquels il est possible d'interagir par le texte ou la voix.
traitement audio
- Entrer : "Isoler la voix du bruit de fond dans audio.mp3".
- Renvoie le fichier audio traité.
Débogage et journalisation
- Emplacement du journal :
- Fenêtres.
%APPDATA%\Claude\logs\mcp-server-elevenlabs.log
- macOS.
~/Library/Logs/Claude/mcp-server-elevenlabs.log
- Fenêtres.
- Problèmes de délais : les opérations telles que la conception vocale prennent du temps et peuvent être interrompues en mode développement, mais la tâche sera tout de même achevée.
Résolution des erreurs courantes
- "spawn uvx ENOENT".
- sonde
uvx
Trajectoire :which uvx
- Mettre à jour la configuration, par exemple
"command": "/usr/local/bin/uvx"
.
- sonde
scénario d'application
- création de contenu
- Les producteurs de podcasts utilisent la synthèse vocale pour générer une narration ou clonent leurs propres voix pour produire des fichiers audio en masse.
- Éducation et formation
- Les enseignants convertissent le texte des leçons en discours pour créer des supports d'apprentissage audio.
- service client
- Les entreprises utilisent l'IA conversationnelle pour créer un service client vocal afin de traiter les demandes courantes.
- développement de jeux
- Les développeurs créent des voix uniques pour les personnages afin de renforcer l'immersion.
QA
- Dois-je payer ?
- Le niveau gratuit offre 10 000 points par mois, au-delà desquels vous devez souscrire un plan payant.
- Quelles sont les langues prises en charge ?
- Prise en charge de l'anglais, du chinois et d'autres langues, voir le site officiel d'ElevenLabs.
- Comment vérifier l'utilisation ?
- Connectez-vous au site Web d'ElevenLabs et consultez la consommation de points sur la page de votre compte.
© déclaration de droits d'auteur
L'article est protégé par le droit d'auteur et ne doit pas être reproduit sans autorisation.
Articles connexes
Pas de commentaires...