일레븐랩스 MCP: 음성 생성 MCP 서비스

최신 AI 리소스4 개월 전에 게시 됨 AI 공유 서클
2.1K 00

일반 소개

ElevenLabsMCP ElevenLabs는 GitHub에서 호스팅되는 공식 오픈 소스 프로젝트입니다. 이 도구는 모델 컨텍스트 프로토콜(MCP)을 기반으로 하는 서버 도구로, AI 모델과 ElevenLabs의 음성 및 오디오 처리 기능을 연결하도록 설계되었습니다. 이 도구를 사용하면 텍스트를 자연스러운 음성으로 변환하고, 개인화된 음성을 복제하고, 오디오를 전사하고, 대화할 수 있는 AI 에이전트를 만들 수도 있습니다. 다음과의 협업을 지원합니다. Claude 데스크톱, 커서, 윈드서프 등의 클라이언트 통합을 통해 개발자는 로컬에서 서버를 실행하고 ElevenLabs의 클라우드 기반 API를 통해 오디오 작업을 처리할 수 있습니다. 프로젝트의 무료 티어는 개인 테스트를 위한 월 10,000 크레딧을 제공하며, 유료 플랜은 더 큰 규모의 사용을 지원합니다.

ElevenLabs MCP:语音生成MCP服务

 

기능 목록

  • 텍스트 음성 변환다양한 톤과 언어를 지원하여 텍스트를 부드럽고 자연스러운 음성으로 변환합니다.
  • 음성 복제오디오 샘플에서 고유한 AI 사운드를 생성합니다.
  • 음성-텍스트 변환:: 다중 화자 인식을 지원하여 오디오 파일을 텍스트로 변환합니다.
  • 대화 AI:: 음성으로 소통할 수 있고 아웃바운드 통화 등에 사용할 수 있는 지능형 에이전트를 만듭니다.
  • 오디오 처리방음 및 음질 향상과 같은 유용한 기능을 제공합니다.
  • 로컬 서버 지원사용자 디바이스에서 서버를 실행하여 클라우드 API에 연결합니다.

 

도움말 사용

설치 프로세스

ElevenLabs MCP를 사용하려면 로컬에 서버를 설치하고 구성해야 합니다. 자세한 단계는 다음과 같습니다:

  1. 환경 준비하기
    • 컴퓨터에 Python 3.8 이상이 설치되어 있는지 확인합니다. 다음 명령을 사용합니다. python --version 버전을 확인합니다.
    • ElevenLabs API 키 받기. 액세스 일레븐랩스 공식 웹사이트등록한 후 설정 페이지에서 키를 찾습니다.
    • 권장 설치 uv(파이썬 패키지 관리자). 다음 명령을 사용합니다. curl -LsSf https://astral.sh/uv/install.sh | sh 설치를 참조하거나 자외선 창고.
  2. 프로젝트 다운로드
    • 터미널을 열고 입력합니다:
      git clone https://github.com/elevenlabs/elevenlabs-mcp.git
      cd elevenlabs-mcp
      
  3. 종속성 설치
    • 비용 또는 지출 uv 설치:
      uv pip install -r requirements.txt
      
    • 또는 기본값 pip::
      pip install -r requirements.txt
      
  4. API 키 구성
    • 방법 1: 런타임에 키를 입력합니다:
      python -m elevenlabs_mcp --api-key=你的API密钥
      
    • 방법 2: 환경 변수 설정하기. 터미널에 입력합니다:
      export ELEVENLABS_API_KEY=你的API密钥
      

      그런 다음 실행합니다:

      python -m elevenlabs_mcp
      
  5. 서버 시작
    • 기본 주소는 다음과 같습니다. http://127.0.0.1:8000. 포트 충돌이 있는 경우 --port 수정:
      python -m elevenlabs_mcp --port=8080
      
  6. 클라이언트 연결
    • 클로드 데스크톱
      • 클로드 데스크톱을 열고 왼쪽 상단 모서리에 있는 메뉴 > 도움말 > 개발자 모드 활성화를 클릭합니다(Windows 사용자는 활성화해야 합니다).
      • 설정 > 개발자 > 구성 편집으로 이동하여 구성을 추가합니다:
        {
        "mcpServers": {
        "ElevenLabs": {
        "command": "uvx",
        "args": ["elevenlabs-mcp"],
        "env": {
        "ELEVENLABS_API_KEY": "你的API密钥"
        }
        }
        }
        }
        
      • Claude를 저장하고 다시 시작합니다.
    • 기타 클라이언트(예: 커서, 윈드서핑)
      • 패키지를 설치합니다:
        pip install elevenlabs-mcp
        
      • 실행하고 구성을 가져옵니다:
        python -m elevenlabs_mcp --api-key=你的API密钥 --print
        
      • 출력 구성을 클라이언트의 지정된 디렉터리에 붙여넣습니다.

기능 작동 흐름

텍스트 음성 변환

  • Claude를 입력하세요: "ElevenLabs로 '안녕하세요, 저는 ElevenLabs입니다'라는 음성 생성."
  • 서버가 오디오를 생성하여 반환하면 클로드가 자동으로 재생합니다. 톤을 지정할 수 있습니다(예: "음성: 아담").

음성 복제

  • 2~3개의 선명한 오디오 샘플을 준비합니다(예 sample.wav).
  • "[sample.wav]로 음성 복제"를 입력합니다.
  • 서버는 새 음성을 생성하는 데 사용되는 음성 ID를 반환합니다.

음성-텍스트 변환

  • 오디오 파일 업로드(예 audio.mp3).
  • "ElevenLabs로 오디오 녹음: audio.mp3"라고 입력합니다.
  • 전사된 텍스트를 반환하고 화자가 여러 명인 경우 다른 화자를 인식합니다.

대화 AI

  • 입력: "탐정처럼 말하고 영화 질문에 대답하는 AI 에이전트 만들기."
  • 서버는 텍스트나 음성을 통해 상호작용할 수 있는 음성으로 상담원을 생성합니다.

오디오 처리

  • "오디오.mp3의 배경 소음에서 음성 분리"를 입력합니다.
  • 처리된 오디오 파일을 반환합니다.

디버깅 및 로깅

  • 로그 위치:
    • Windows. %APPDATA%\Claude\logs\mcp-server-elevenlabs.log
    • macOS. ~/Library/Logs/Claude/mcp-server-elevenlabs.log
  • 시간 초과 문제: 음성 디자인과 같은 작업은 시간이 많이 걸리며 개발 모드에서 시간이 초과될 수 있지만 작업은 계속 완료됩니다.

일반적인 오류 해결

  • "spawn uvx ENOENT".
    • 프로브 uvx 경로:
      which uvx
      
    • 예를 들어 다음과 같이 구성을 업데이트합니다. "command": "/usr/local/bin/uvx".

 

애플리케이션 시나리오

  1. 콘텐츠 제작
    • 팟캐스트 제작자는 텍스트 음성 변환을 사용하여 내레이션을 생성하거나 자신의 목소리를 복제하여 오디오를 대량으로 제작할 수 있습니다.
  2. 교육 및 훈련
    • 교사는 수업 텍스트를 음성으로 변환하여 오디오 학습 자료를 만들 수 있습니다.
  3. 클라이언트 서비스
    • 기업에서는 대화형 AI를 사용하여 일반적인 문의를 처리하는 음성 고객 서비스를 만들 수 있습니다.
  4. 게임 개발
    • 개발자는 캐릭터의 고유한 음성을 생성하여 몰입감을 높입니다.

 

QA

  1. 결제해야 하나요?
    • 무료 티어는 월 10,000포인트를 제공하며, 그 이상은 유료 요금제를 구매해야 합니다.
  2. 어떤 언어가 지원되나요?
    • 영어, 중국어 및 기타 언어 지원은 ElevenLabs 공식 웹사이트를 참조하세요.
  3. 사용량은 어떻게 확인하나요?
    • ElevenLabs 웹사이트에 로그인하고 계정 페이지에서 포인트 소비를 확인합니다.
© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...