ElevenLabs MCP: Servicio MCP de generación de voz

Introducción general

ElevenLabsMCP ElevenLabs es un proyecto oficial de código abierto alojado en GitHub. Se trata de una herramienta de servidor basada en el protocolo Model Context Protocol (MCP) diseñada para conectar modelos de IA con las capacidades de procesamiento de voz y audio de ElevenLabs. La herramienta permite a los usuarios convertir texto en habla natural, clonar voces personalizadas, transcribir audio e incluso crear agentes conversacionales de IA. Admite la colaboración con Claude Las integraciones de clientes como Desktop, Cursor, Windsurf y otros permiten a los desarrolladores ejecutar servidores localmente y procesar tareas de audio a través de la API basada en la nube de ElevenLabs. El nivel gratuito del proyecto ofrece 10.000 créditos al mes para pruebas personales, mientras que el plan de pago admite un uso a mayor escala.

ElevenLabs MCP:语音生成MCP服务

 

Lista de funciones

  • texto a voz: Convierte palabras en un habla suave y natural, compatible con una amplia gama de tonos e idiomas.
  • clonación de voz: Genera sonidos AI únicos a partir de muestras de audio.
  • voz a texto:: Convierte archivos de audio a texto con soporte para el reconocimiento de varios hablantes.
  • Diálogo AI:: Crear agentes inteligentes que puedan comunicarse por voz y puedan utilizarse para llamadas salientes, etc.
  • procesamiento de audio: Proporciona funciones útiles como el aislamiento acústico y la mejora de la calidad del sonido.
  • Soporte para servidores locales: Ejecuta un servidor en el dispositivo del usuario para conectarse a la API de la nube.

 

Utilizar la ayuda

Proceso de instalación

Para utilizar ElevenLabs MCP, es necesario instalar y configurar el servidor localmente. A continuación se detallan los pasos a seguir:

  1. Preparar el entorno
    • Asegúrese de que Python 3.8 o posterior está instalado en su ordenador. Utilice el comando python --version Comprueba la versión.
    • Obtenga la clave API de ElevenLabs. Accede a Sitio web oficial de ElevenLabsDespués de registrarte, busca la clave en la página de Configuración.
    • Instalación recomendada uv(Gestor de paquetes de Python). Utilice el comando curl -LsSf https://astral.sh/uv/install.sh | sh Instalación, o consulte Almacén uv.
  2. Descargar proyecto
    • Abre un terminal y escribe:
      git clone https://github.com/elevenlabs/elevenlabs-mcp.git
      cd elevenlabs-mcp
      
  3. Instalación de dependencias
    • gasto o desembolso uv Instalación:
      uv pip install -r requirements.txt
      
    • o con el valor por defecto pip::
      pip install -r requirements.txt
      
  4. Configuración de claves API
    • Método 1: Introducir la clave en tiempo de ejecución:
      python -m elevenlabs_mcp --api-key=你的API密钥
      
    • Método 2: Configurar variables de entorno. Escriba en el terminal:
      export ELEVENLABS_API_KEY=你的API密钥
      

      Pues corre:

      python -m elevenlabs_mcp
      
  5. Iniciar el servidor
    • La dirección por defecto es http://127.0.0.1:8000. Si existe un conflicto de puertos, utilice la opción --port Modificación:
      python -m elevenlabs_mcp --port=8080
      
  6. Conexión de clientes
    • Claude Escritorio
      • Abre Claude Desktop y haz clic en Menú > Ayuda > Activar modo desarrollador en la esquina superior izquierda (los usuarios de Windows tienen que activarlo).
      • Vaya a Ajustes > Desarrollador > Editar configuración para añadir una configuración:
        {
        "mcpServers": {
        "ElevenLabs": {
        "command": "uvx",
        "args": ["elevenlabs-mcp"],
        "env": {
        "ELEVENLABS_API_KEY": "你的API密钥"
        }
        }
        }
        }
        
      • Guarda y reinicia Claude.
    • Otros clientes (por ejemplo, Cursor, Windsurf)
      • Instala el paquete:
        pip install elevenlabs-mcp
        
      • Ejecútalo y obtén la configuración:
        python -m elevenlabs_mcp --api-key=你的API密钥 --print
        
      • Pega la configuración de salida en el directorio especificado en el cliente.

Función Flujo de operaciones

texto a voz

  • Escribe en Claude: "Generar discurso: 'Hola, soy ElevenLabs' con ElevenLabs".
  • El servidor genera audio y lo devuelve, Claude lo reproduce automáticamente. Se pueden especificar tonos, por ejemplo, "voz: Adam".

clonación de voz

  • Prepare 2-3 muestras de audio claras (por ejemplo sample.wav).
  • Introduce: "Clonar una voz con [sample.wav]".
  • El servidor devuelve un identificador de voz, que se utiliza para generar una nueva voz.

voz a texto

  • Sube un archivo de audio (por ejemplo audio.mp3).
  • Escribe: "Transcribir audio: audio.mp3 con ElevenLabs".
  • Devuelve el texto transcrito y reconoce a los distintos locutores si hay varios.

Diálogo AI

  • Enter: "Crear un agente de IA que hable como un detective y responda a preguntas de cine".
  • El servidor genera agentes con voz con los que se puede interactuar mediante texto o voz.

procesamiento de audio

  • Introduzca: "Aislar la voz del ruido de fondo en audio.mp3".
  • Devuelve el archivo de audio procesado.

Depuración y registro

  • Ubicación del registro:
    • Ventanas. %APPDATA%\Claude\logs\mcp-server-elevenlabs.log
    • macOS. ~/Library/Logs/Claude/mcp-server-elevenlabs.log
  • Problemas de tiempo de espera: operaciones como el diseño de voz requieren mucho tiempo y pueden agotarse en el modo de desarrollo, pero la tarea se completará igualmente.

Resolución de errores comunes

  • "spawn uvx ENOENT".
    • sonda uvx Senda:
      which uvx
      
    • Actualizar la configuración, por ejemplo "command": "/usr/local/bin/uvx".

 

escenario de aplicación

  1. creación de contenidos
    • Los productores de podcasts utilizan la conversión de texto a voz para generar narraciones o clonan sus propias voces para producir audio en masa.
  2. Educación y formación
    • Los profesores convierten el texto de las lecciones en voz para crear materiales didácticos de audio.
  3. servicio al cliente
    • Las empresas utilizan la IA conversacional para crear un servicio de atención al cliente por voz que atienda las consultas más habituales.
  4. desarrollo de juegos
    • Los desarrolladores generan voces únicas para los personajes con el fin de aumentar la inmersión.

 

CONTROL DE CALIDAD

  1. ¿Tengo que pagar?
    • El nivel gratuito ofrece 10.000 puntos al mes, a partir de los cuales es necesario contratar un plan de pago.
  2. ¿Qué idiomas se admiten?
    • Soporta inglés, chino y otros idiomas, consulta la web oficial de ElevenLabs.
  3. ¿Cómo puedo comprobar el uso?
    • Inicia sesión en el sitio web de ElevenLabs y consulta el consumo de puntos en la página de tu cuenta.
© declaración de copyright
AiPPT

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...