Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife

MCP da ElevenLabs: serviço de MCP de geração de fala

Introdução geral

ElevenLabs MCP O ElevenLabs é um projeto oficial de código aberto hospedado no GitHub. É uma ferramenta de servidor baseada no Protocolo de Contexto de Modelo (MCP) projetado para conectar modelos de IA com os recursos de processamento de áudio e fala do ElevenLabs. A ferramenta permite que os usuários convertam texto em fala natural, clonem vozes personalizadas, transcrevam áudio e até mesmo criem agentes de IA de conversação. Ela oferece suporte à colaboração com Claude As integrações de clientes, como Desktop, Cursor, Windsurf e outras, permitem que os desenvolvedores executem servidores localmente e processem tarefas de áudio por meio da API baseada em nuvem da ElevenLabs. A camada gratuita do projeto oferece 10.000 créditos por mês para testes pessoais, enquanto o plano pago oferece suporte ao uso em maior escala.

ElevenLabs MCP: Serviço de geração de fala MCP-1


 

Lista de funções

  • conversão de texto em falaTransforme palavras em uma fala fluente e natural, com suporte a uma ampla variedade de tons e idiomas.
  • clonagem de falaGeração de sons de IA exclusivos a partir de amostras de áudio.
  • conversão de voz em textoConversão de arquivos de áudio em texto com suporte para reconhecimento de vários alto-falantes.
  • IA de diálogo: criar agentes inteligentes que possam se comunicar por voz e ser usados para chamadas de saída, etc.
  • processamento de áudioFunção de isolamento de som: Oferece funções úteis, como isolamento de som e aprimoramento da qualidade do som.
  • Suporte ao servidor localExecute um servidor no dispositivo do usuário para se conectar à API da nuvem.

 

Usando a Ajuda

Processo de instalação

Para usar o MCP da ElevenLabs, você precisa instalar e configurar o servidor localmente. Veja a seguir as etapas detalhadas:

  1. Preparação do ambiente
    • Certifique-se de que o Python 3.8 ou posterior esteja instalado em seu computador. Use o comando python --version Verifique a versão.
    • Obtenha a chave de API da ElevenLabs. Acesso a Site oficial da ElevenLabsApós o registro, localize a chave na página Settings (Configurações).
    • Instalação recomendada uv(Gerenciador de pacotes Python). Use o comando curl -LsSf https://astral.sh/uv/install.sh | sh Instalação, ou consulte Armazém uv.
  2. Download do projeto
    • Abra um terminal e digite:
      git clone https://github.com/elevenlabs/elevenlabs-mcp.git
      cd elevenlabs-mcp
      
  3. Instalação de dependências
    • despesa ou gasto uv Instalação:
      uv pip install -r requirements.txt
      
    • ou com o padrão pip::
      pip install -r requirements.txt
      
  4. Configuração de chaves de API
    • Método 1: Digite a chave em tempo de execução:
      python -m elevenlabs_mcp --api-key=你的API密钥
      
    • Método 2: Definir variáveis de ambiente. Digite no terminal:
      export ELEVENLABS_API_KEY=你的API密钥
      

      Então corra:

      python -m elevenlabs_mcp
      
  5. Iniciar o servidor
    • O endereço padrão é http://127.0.0.1:8000. Se houver um conflito de portas, use a opção --port Modificação:
      python -m elevenlabs_mcp --port=8080
      
  6. Conectando clientes
    • Área de trabalho do Claude
      • Abra o Claude Desktop e clique em Menu > Help > Enable Developer Mode no canto superior esquerdo (os usuários do Windows precisam ativá-lo).
      • Vá para Configurações > Desenvolvedor > Editar configuração para adicionar uma configuração:
        {
        "mcpServers": {
        "ElevenLabs": {
        "command": "uvx",
        "args": ["elevenlabs-mcp"],
        "env": {
        "ELEVENLABS_API_KEY": "你的API密钥"
        }
        }
        }
        }
        
      • Salve e reinicie o Claude.
    • Outros clientes (por exemplo, Cursor, Windsurf)
      • Instale o pacote:
        pip install elevenlabs-mcp
        
      • Execute-o e obtenha a configuração:
        python -m elevenlabs_mcp --api-key=你的API密钥 --print
        
      • Colar a configuração de saída no diretório especificado no cliente.

Função Fluxo de operação

conversão de texto em fala

  • Digite Claude: "Generate speech: 'Hello, I'm ElevenLabs' with ElevenLabs".
  • O servidor gera áudio e o retorna, e o Claude o reproduz automaticamente. Os tons podem ser especificados, por exemplo, "voz: Adam".

clonagem de fala

  • Prepare de 2 a 3 amostras de áudio nítidas (por exemplo sample.wav).
  • Digite: "Clone a voice with [sample.wav]".
  • O servidor retorna uma ID de voz, que é usada para gerar uma nova voz.

conversão de voz em texto

  • Faça upload de um arquivo de áudio (por exemplo audio.mp3).
  • Digite "Transcribe audio: audio.mp3 with ElevenLabs".
  • Retorna o texto transcrito e reconhece diferentes falantes se houver vários falantes.

IA de diálogo

  • Digite: "Crie um agente de IA que fale como um detetive e responda a perguntas sobre filmes".
  • O servidor gera agentes com fala que podem ser interagidos por meio de texto ou voz.

processamento de áudio

  • Digite: "Isolar a voz do ruído de fundo em audio.mp3".
  • Retorna o arquivo de áudio processado.

Depuração e registro em log

  • Local do registro:
    • Windows. %APPDATA%\Claude\logs\mcp-server-elevenlabs.log
    • macOS. ~/Library/Logs/Claude/mcp-server-elevenlabs.log
  • Problemas de tempo limite: operações como o design de voz consomem tempo e podem ter um tempo limite no modo de desenvolvimento, mas a tarefa ainda será concluída.

Resolução de erros comuns

  • "spawn uvx ENOENT".
    • sonda uvx Caminho:
      which uvx
      
    • Atualize a configuração, por exemplo. "command": "/usr/local/bin/uvx".

 

cenário do aplicativo

  1. criação de conteúdo
    • Os produtores de podcast usam a conversão de texto em fala para gerar narração ou clonam suas próprias vozes para produzir áudio em massa.
  2. Educação e treinamento
    • Os professores convertem o texto da aula em fala para criar materiais didáticos em áudio.
  3. atendimento ao cliente
    • As empresas usam a IA conversacional para criar um serviço de atendimento ao cliente por voz para lidar com consultas comuns.
  4. desenvolvimento de jogos
    • Os desenvolvedores geram vozes exclusivas para os personagens para aumentar a imersão.

 

QA

  1. Preciso pagar?
    • O nível gratuito oferece 10.000 pontos/mês, além dos quais você precisa adquirir um plano pago.
  2. Quais são os idiomas suportados?
    • Suporte a inglês, chinês e outros idiomas, consulte o site oficial da ElevenLabs.
  3. Como faço para verificar o uso?
    • Faça login no site da ElevenLabs e visualize o consumo de pontos na página de sua conta.
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " MCP da ElevenLabs: serviço de MCP de geração de fala
pt_BRPortuguês do Brasil