일레븐랩스 MCP: 음성 생성 MCP 서비스

52.7K 00

일반 소개

ElevenLabs MCP ElevenLabs는 GitHub에서 호스팅되는 공식 오픈 소스 프로젝트입니다. 이 도구는 모델 컨텍스트 프로토콜(MCP)을 기반으로 하는 서버 도구로, AI 모델과 ElevenLabs의 음성 및 오디오 처리 기능을 연결하도록 설계되었습니다. 이 도구를 사용하면 텍스트를 자연스러운 음성으로 변환하고, 개인화된 음성을 복제하고, 오디오를 전사하고, 대화할 수 있는 AI 에이전트를 만들 수도 있습니다. 다음과의 협업을 지원합니다. Claude 데스크톱, 커서, 윈드서프 등의 클라이언트 통합을 통해 개발자는 로컬에서 서버를 실행하고 ElevenLabs의 클라우드 기반 API를 통해 오디오 작업을 처리할 수 있습니다. 프로젝트의 무료 티어는 개인 테스트를 위한 월 10,000 크레딧을 제공하며, 유료 플랜은 더 큰 규모의 사용을 지원합니다.

기능 목록

텍스트 음성 변환다양한 톤과 언어를 지원하여 텍스트를 부드럽고 자연스러운 음성으로 변환합니다.
음성 복제오디오 샘플에서 고유한 AI 사운드를 생성합니다.
음성-텍스트 변환:: 다중 화자 인식을 지원하여 오디오 파일을 텍스트로 변환합니다.
대화 AI:: 음성으로 소통할 수 있고 아웃바운드 통화 등에 사용할 수 있는 지능형 에이전트를 만듭니다.
오디오 처리방음 및 음질 향상과 같은 유용한 기능을 제공합니다.
로컬 서버 지원사용자 디바이스에서 서버를 실행하여 클라우드 API에 연결합니다.

도움말 사용

설치 프로세스

ElevenLabs MCP를 사용하려면 로컬에 서버를 설치하고 구성해야 합니다. 자세한 단계는 다음과 같습니다:

환경 준비하기
- 컴퓨터에 Python 3.8 이상이 설치되어 있는지 확인합니다. 다음 명령을 사용합니다. python --version 버전을 확인합니다.
- ElevenLabs API 키 받기. 액세스 일레븐랩스 공식 웹사이트등록한 후 설정 페이지에서 키를 찾습니다.
- 권장 설치 uv(파이썬 패키지 관리자). 다음 명령을 사용합니다. curl -LsSf https://astral.sh/uv/install.sh | sh 설치를 참조하거나 자외선 창고.

프로젝트 다운로드

터미널을 열고 입력합니다:

git clone https://github.com/elevenlabs/elevenlabs-mcp.git
cd elevenlabs-mcp

종속성 설치

비용 또는 지출 uv 설치:
```
uv pip install -r requirements.txt
```
또는 기본값 pip::
```
pip install -r requirements.txt
```

API 키 구성
- 방법 1: 런타임에 키를 입력합니다:
```
python -m elevenlabs_mcp --api-key=你的API密钥
```
- 방법 2: 환경 변수 설정하기. 터미널에 입력합니다:
```
export ELEVENLABS_API_KEY=你的API密钥
```
  그런 다음 실행합니다:
```
python -m elevenlabs_mcp
```
서버 시작
- 기본 주소는 다음과 같습니다. http://127.0.0.1:8000. 포트 충돌이 있는 경우 --port 수정:
```
python -m elevenlabs_mcp --port=8080
```
클라이언트 연결
- 클로드 데스크톱
  - 클로드 데스크톱을 열고 왼쪽 상단 모서리에 있는 메뉴 > 도움말 > 개발자 모드 활성화를 클릭합니다(Windows 사용자는 활성화해야 합니다).
  - 설정 > 개발자 > 구성 편집으로 이동하여 구성을 추가합니다:
```
{
"mcpServers": {
"ElevenLabs": {
"command": "uvx",
"args": ["elevenlabs-mcp"],
"env": {
"ELEVENLABS_API_KEY": "你的API密钥"
}
}
}
}
```
  - Claude를 저장하고 다시 시작합니다.
- 기타 클라이언트(예: 커서, 윈드서핑)
  - 패키지를 설치합니다:
```
pip install elevenlabs-mcp
```
  - 실행하고 구성을 가져옵니다:
```
python -m elevenlabs_mcp --api-key=你的API密钥 --print
```
  - 출력 구성을 클라이언트의 지정된 디렉터리에 붙여넣습니다.

기능 작동 흐름

텍스트 음성 변환

Claude를 입력하세요: "ElevenLabs로 '안녕하세요, 저는 ElevenLabs입니다'라는 음성 생성."
서버가 오디오를 생성하여 반환하면 클로드가 자동으로 재생합니다. 톤을 지정할 수 있습니다(예: "음성: 아담").

음성 복제

2~3개의 선명한 오디오 샘플을 준비합니다(예 sample.wav).
"[sample.wav]로 음성 복제"를 입력합니다.
서버는 새 음성을 생성하는 데 사용되는 음성 ID를 반환합니다.

음성-텍스트 변환

오디오 파일 업로드(예 audio.mp3).
"ElevenLabs로 오디오 녹음: audio.mp3"라고 입력합니다.
전사된 텍스트를 반환하고 화자가 여러 명인 경우 다른 화자를 인식합니다.

대화 AI

입력: "탐정처럼 말하고 영화 질문에 대답하는 AI 에이전트 만들기."
서버는 텍스트나 음성을 통해 상호작용할 수 있는 음성으로 상담원을 생성합니다.

오디오 처리

"오디오.mp3의 배경 소음에서 음성 분리"를 입력합니다.
처리된 오디오 파일을 반환합니다.

디버깅 및 로깅

로그 위치:
- Windows. %APPDATA%\Claude\logs\mcp-server-elevenlabs.log
- macOS. ~/Library/Logs/Claude/mcp-server-elevenlabs.log
시간 초과 문제: 음성 디자인과 같은 작업은 시간이 많이 걸리며 개발 모드에서 시간이 초과될 수 있지만 작업은 계속 완료됩니다.

일반적인 오류 해결

"spawn uvx ENOENT".
- 프로브 uvx 경로:
```
which uvx
```
- 예를 들어 다음과 같이 구성을 업데이트합니다. "command": "/usr/local/bin/uvx".

애플리케이션 시나리오

콘텐츠 제작
- 팟캐스트 제작자는 텍스트 음성 변환을 사용하여 내레이션을 생성하거나 자신의 목소리를 복제하여 오디오를 대량으로 제작할 수 있습니다.
교육 및 훈련
- 교사는 수업 텍스트를 음성으로 변환하여 오디오 학습 자료를 만들 수 있습니다.
클라이언트 서비스
- 기업에서는 대화형 AI를 사용하여 일반적인 문의를 처리하는 음성 고객 서비스를 만들 수 있습니다.
게임 개발
- 개발자는 캐릭터의 고유한 음성을 생성하여 몰입감을 높입니다.

QA

결제해야 하나요?
- 무료 티어는 월 10,000포인트를 제공하며, 그 이상은 유료 요금제를 구매해야 합니다.
어떤 언어가 지원되나요?
- 영어, 중국어 및 기타 언어 지원은 ElevenLabs 공식 웹사이트를 참조하세요.
사용량은 어떻게 확인하나요?
- ElevenLabs 웹사이트에 로그인하고 계정 페이지에서 포인트 소비를 확인합니다.

최신 AI 리소스 # AI 텍스트 음성 변환 # MCP 서비스

토마토 저작 도구: 라이선스 소설과 단편 연극 대본을 동영상으로 변환하고, 홍보 및 트래픽 생성을 위한 짧은 동영상을 생성합니다.

1 년 전

074.8K

MobileCLIP2 - Apple의 효율적인 오픈 소스 엔드사이드 멀티모달 모델

최신 AI 리소스

6개월 전

043.6K

Thin-Plate-Spline-Motion-Model：静态人像图参考视频人像动作生成视频

박판-스플라인-모션 모델: 정적 인물 맵 레퍼런스 비디오 인물 모션 생성 비디오

1 년 전

051.3K

Continue：与VS Code集成并自定义模型和embedding的开源AI代码助手

계속: VS Code와 통합되고 모델 및 임베딩을 사용자 지정하는 오픈 소스 AI 코드 도우미

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

080.8K

댓글 없음

댓글에 참여하려면 로그인해야 합니다!

지금 로그인

댓글 없음...

일레븐랩스 MCP: 음성 생성 MCP 서비스

일반 소개

기능 목록

도움말 사용

설치 프로세스

기능 작동 흐름

텍스트 음성 변환

음성 복제

음성-텍스트 변환

대화 AI

오디오 처리

디버깅 및 로깅

일반적인 오류 해결

애플리케이션 시나리오

QA

Clarisign: AI로 계약서 초안을 빠르게 작성하고 서명할 수 있는 스마트 도구

Thera: 모든 크기의 이미지 확대, 디앨리어싱 오픈 소스 도구

관련 문서

토마토 저작 도구: 라이선스 소설과 단편 연극 대본을 동영상으로 변환하고, 홍보 및 트래픽 생성을 위한 짧은 동영상을 생성합니다.

MobileCLIP2 - Apple의 효율적인 오픈 소스 엔드사이드 멀티모달 모델

박판-스플라인-모션 모델: 정적 인물 맵 레퍼런스 비디오 인물 모션 생성 비디오

계속: VS Code와 통합되고 모델 및 임베딩을 사용자 지정하는 오픈 소스 AI 코드 도우미

댓글 없음

최신 컬렉션

최신 기사

일레븐랩스 MCP: 음성 생성 MCP 서비스

일반 소개

기능 목록

도움말 사용

설치 프로세스

기능 작동 흐름

텍스트 음성 변환

음성 복제

음성-텍스트 변환

대화 AI

오디오 처리

디버깅 및 로깅

일반적인 오류 해결

애플리케이션 시나리오

QA

Clarisign: AI로 계약서 초안을 빠르게 작성하고 서명할 수 있는 스마트 도구

Thera: 모든 크기의 이미지 확대, 디앨리어싱 오픈 소스 도구

관련 문서

토마토 저작 도구: 라이선스 소설과 단편 연극 대본을 동영상으로 변환하고, 홍보 및 트래픽 생성을 위한 짧은 동영상을 생성합니다.

MobileCLIP2 - Apple의 효율적인 오픈 소스 엔드사이드 멀티모달 모델

박판-스플라인-모션 모델: 정적 인물 맵 레퍼런스 비디오 인물 모션 생성 비디오

계속: VS Code와 통합되고 모델 및 임베딩을 사용자 지정하는 오픈 소스 AI 코드 도우미

댓글 없음

선택한 AI 도구

최신 컬렉션

최신 기사