일반 소개
ElevenLabsMCP ElevenLabs는 GitHub에서 호스팅되는 공식 오픈 소스 프로젝트입니다. 이 도구는 모델 컨텍스트 프로토콜(MCP)을 기반으로 하는 서버 도구로, AI 모델과 ElevenLabs의 음성 및 오디오 처리 기능을 연결하도록 설계되었습니다. 이 도구를 사용하면 텍스트를 자연스러운 음성으로 변환하고, 개인화된 음성을 복제하고, 오디오를 전사하고, 대화할 수 있는 AI 에이전트를 만들 수도 있습니다. 다음과의 협업을 지원합니다. Claude 데스크톱, 커서, 윈드서프 등의 클라이언트 통합을 통해 개발자는 로컬에서 서버를 실행하고 ElevenLabs의 클라우드 기반 API를 통해 오디오 작업을 처리할 수 있습니다. 프로젝트의 무료 티어는 개인 테스트를 위한 월 10,000 크레딧을 제공하며, 유료 플랜은 더 큰 규모의 사용을 지원합니다.

기능 목록
- 텍스트 음성 변환다양한 톤과 언어를 지원하여 텍스트를 부드럽고 자연스러운 음성으로 변환합니다.
- 음성 복제오디오 샘플에서 고유한 AI 사운드를 생성합니다.
- 음성-텍스트 변환:: 다중 화자 인식을 지원하여 오디오 파일을 텍스트로 변환합니다.
- 대화 AI:: 음성으로 소통할 수 있고 아웃바운드 통화 등에 사용할 수 있는 지능형 에이전트를 만듭니다.
- 오디오 처리방음 및 음질 향상과 같은 유용한 기능을 제공합니다.
- 로컬 서버 지원사용자 디바이스에서 서버를 실행하여 클라우드 API에 연결합니다.
도움말 사용
설치 프로세스
ElevenLabs MCP를 사용하려면 로컬에 서버를 설치하고 구성해야 합니다. 자세한 단계는 다음과 같습니다:
- 환경 준비하기
- 컴퓨터에 Python 3.8 이상이 설치되어 있는지 확인합니다. 다음 명령을 사용합니다.
python --version
버전을 확인합니다. - ElevenLabs API 키 받기. 액세스 일레븐랩스 공식 웹사이트등록한 후 설정 페이지에서 키를 찾습니다.
- 권장 설치
uv
(파이썬 패키지 관리자). 다음 명령을 사용합니다.curl -LsSf https://astral.sh/uv/install.sh | sh
설치를 참조하거나 자외선 창고.
- 컴퓨터에 Python 3.8 이상이 설치되어 있는지 확인합니다. 다음 명령을 사용합니다.
- 프로젝트 다운로드
- 터미널을 열고 입력합니다:
git clone https://github.com/elevenlabs/elevenlabs-mcp.git cd elevenlabs-mcp
- 터미널을 열고 입력합니다:
- 종속성 설치
- 비용 또는 지출
uv
설치:uv pip install -r requirements.txt
- 또는 기본값
pip
::pip install -r requirements.txt
- 비용 또는 지출
- API 키 구성
- 방법 1: 런타임에 키를 입력합니다:
python -m elevenlabs_mcp --api-key=你的API密钥
- 방법 2: 환경 변수 설정하기. 터미널에 입력합니다:
export ELEVENLABS_API_KEY=你的API密钥
그런 다음 실행합니다:
python -m elevenlabs_mcp
- 방법 1: 런타임에 키를 입력합니다:
- 서버 시작
- 기본 주소는 다음과 같습니다.
http://127.0.0.1:8000
. 포트 충돌이 있는 경우--port
수정:python -m elevenlabs_mcp --port=8080
- 기본 주소는 다음과 같습니다.
- 클라이언트 연결
- 클로드 데스크톱
- 클로드 데스크톱을 열고 왼쪽 상단 모서리에 있는 메뉴 > 도움말 > 개발자 모드 활성화를 클릭합니다(Windows 사용자는 활성화해야 합니다).
- 설정 > 개발자 > 구성 편집으로 이동하여 구성을 추가합니다:
{ "mcpServers": { "ElevenLabs": { "command": "uvx", "args": ["elevenlabs-mcp"], "env": { "ELEVENLABS_API_KEY": "你的API密钥" } } } }
- Claude를 저장하고 다시 시작합니다.
- 기타 클라이언트(예: 커서, 윈드서핑)
- 패키지를 설치합니다:
pip install elevenlabs-mcp
- 실행하고 구성을 가져옵니다:
python -m elevenlabs_mcp --api-key=你的API密钥 --print
- 출력 구성을 클라이언트의 지정된 디렉터리에 붙여넣습니다.
- 패키지를 설치합니다:
- 클로드 데스크톱
기능 작동 흐름
텍스트 음성 변환
- Claude를 입력하세요: "ElevenLabs로 '안녕하세요, 저는 ElevenLabs입니다'라는 음성 생성."
- 서버가 오디오를 생성하여 반환하면 클로드가 자동으로 재생합니다. 톤을 지정할 수 있습니다(예: "음성: 아담").
음성 복제
- 2~3개의 선명한 오디오 샘플을 준비합니다(예
sample.wav
). - "[sample.wav]로 음성 복제"를 입력합니다.
- 서버는 새 음성을 생성하는 데 사용되는 음성 ID를 반환합니다.
음성-텍스트 변환
- 오디오 파일 업로드(예
audio.mp3
). - "ElevenLabs로 오디오 녹음: audio.mp3"라고 입력합니다.
- 전사된 텍스트를 반환하고 화자가 여러 명인 경우 다른 화자를 인식합니다.
대화 AI
- 입력: "탐정처럼 말하고 영화 질문에 대답하는 AI 에이전트 만들기."
- 서버는 텍스트나 음성을 통해 상호작용할 수 있는 음성으로 상담원을 생성합니다.
오디오 처리
- "오디오.mp3의 배경 소음에서 음성 분리"를 입력합니다.
- 처리된 오디오 파일을 반환합니다.
디버깅 및 로깅
- 로그 위치:
- Windows.
%APPDATA%\Claude\logs\mcp-server-elevenlabs.log
- macOS.
~/Library/Logs/Claude/mcp-server-elevenlabs.log
- Windows.
- 시간 초과 문제: 음성 디자인과 같은 작업은 시간이 많이 걸리며 개발 모드에서 시간이 초과될 수 있지만 작업은 계속 완료됩니다.
일반적인 오류 해결
- "spawn uvx ENOENT".
- 프로브
uvx
경로:which uvx
- 예를 들어 다음과 같이 구성을 업데이트합니다.
"command": "/usr/local/bin/uvx"
.
- 프로브
애플리케이션 시나리오
- 콘텐츠 제작
- 팟캐스트 제작자는 텍스트 음성 변환을 사용하여 내레이션을 생성하거나 자신의 목소리를 복제하여 오디오를 대량으로 제작할 수 있습니다.
- 교육 및 훈련
- 교사는 수업 텍스트를 음성으로 변환하여 오디오 학습 자료를 만들 수 있습니다.
- 클라이언트 서비스
- 기업에서는 대화형 AI를 사용하여 일반적인 문의를 처리하는 음성 고객 서비스를 만들 수 있습니다.
- 게임 개발
- 개발자는 캐릭터의 고유한 음성을 생성하여 몰입감을 높입니다.
QA
- 결제해야 하나요?
- 무료 티어는 월 10,000포인트를 제공하며, 그 이상은 유료 요금제를 구매해야 합니다.
- 어떤 언어가 지원되나요?
- 영어, 중국어 및 기타 언어 지원은 ElevenLabs 공식 웹사이트를 참조하세요.
- 사용량은 어떻게 확인하나요?
- ElevenLabs 웹사이트에 로그인하고 계정 페이지에서 포인트 소비를 확인합니다.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...