はじめに
イレブンラボ エムシーピー ElevenLabsはGitHubでホストされている公式のオープンソースプロジェクトです。モデル・コンテキスト・プロトコル(MCP)に基づくサーバー・ツールで、AIモデルとElevenLabsの音声・音声処理機能を接続するように設計されている。このツールにより、ユーザーはテキストを自然な音声に変換したり、パーソナライズされた音声を作成したり、音声を書き起こしたり、会話AIエージェントを作成したりすることができる。以下のようなコラボレーションをサポートします。 クロード Desktop、Cursor、Windsurfなどのクライアント統合により、開発者はローカルでサーバーを実行し、ElevenLabsのクラウドベースのAPIを通じてオーディオタスクを処理できる。このプロジェクトの無料版では、個人的なテスト用に毎月10,000クレジットが提供され、有料プランではより大規模な利用がサポートされる。
機能一覧
- 音声合成流暢で自然な音声に変換し、様々なトーンや言語をサポートします。
- ボイスクローニングオーディオサンプルからユニークなAIサウンドを生成します。
- 音声テキスト音声ファイルをテキストに変換します。
- 対話AI音声によるコミュニケーションが可能で、アウトバウンドコールなどに利用できるインテリジェントエージェントを作る。
- 音響処理遮音や音質向上など便利な機能を提供。
- ローカル・サーバー・サポートクラウドAPIに接続するために、ユーザーのデバイス上でサーバーを実行する。
ヘルプの使用
設置プロセス
ElevenLabs MCP を使用するには、サーバーをローカルにインストールし、設定する必要があります。以下はその詳細な手順です:
- 環境を整える
- Python 3.8以降がコンピュータにインストールされていることを確認してください。コマンド
python --version
バージョンを確認する。 - イレブンラボのAPIキーを取得します。アクセス イレブンラボ公式サイト登録後、設定ページでキーを見つけます。
- 推奨される設置方法
uv
(Python Package Manager)。コマンドcurl -LsSf https://astral.sh/uv/install.sh | sh
インストール、または 紫外線倉庫.
- Python 3.8以降がコンピュータにインストールされていることを確認してください。コマンド
- ダウンロード・プロジェクト
- ターミナルを開き、こう入力する:
git clone https://github.com/elevenlabs/elevenlabs-mcp.git cd elevenlabs-mcp
- ターミナルを開き、こう入力する:
- 依存関係のインストール
- 支出
uv
インストール:uv pip install -r requirements.txt
- またはデフォルトの
pip
::pip install -r requirements.txt
- 支出
- APIキーの設定
- 方法1:実行時にキーを入力する:
python -m elevenlabs_mcp --api-key=你的API密钥
- 方法2:環境変数を設定する。ターミナルで
export ELEVENLABS_API_KEY=你的API密钥
それから走れ:
python -m elevenlabs_mcp
- 方法1:実行時にキーを入力する:
- サーバーの起動
- デフォルトのアドレスは
http://127.0.0.1:8000
.ポートが競合している場合は--port
修正:python -m elevenlabs_mcp --port=8080
- デフォルトのアドレスは
- 顧客をつなぐ
- クロード・デスクトップ
- クロードデスクトップを開き、左上のメニュー>ヘルプ>開発者モードを有効にするをクリックします(Windowsユーザーは有効にする必要があります)。
- 設定」>「開発者」>「設定の編集」で設定を追加します:
{ "mcpServers": { "ElevenLabs": { "command": "uvx", "args": ["elevenlabs-mcp"], "env": { "ELEVENLABS_API_KEY": "你的API密钥" } } } }
- 保存してクロードを再起動する。
- その他のクライアント(Cursor、Windsurfなど)
- パッケージをインストールする:
pip install elevenlabs-mcp
- 実行し、コンフィギュレーションを取得する:
python -m elevenlabs_mcp --api-key=你的API密钥 --print
- クライアント上の指定されたディレクトリに出力設定を貼り付ける。
- パッケージをインストールする:
- クロード・デスクトップ
機能 操作の流れ
音声合成
- クロードに「イレブンラボで『こんにちは、イレブンラボです』とスピーチを生成してください」と入力する。
- サーバーが音声を生成して返し、クロードが自動的に再生する。音色は "voice: Adam "のように指定できる。
ボイスクローニング
- クリアなオーディオ・サンプルを2-3曲用意する(例
sample.wav
). - "Clone a Voice with [sample.wav]"と入力してください。
- サーバーは、新しい音声を生成するために使用される音声IDを返す。
音声テキスト
- オーディオファイルをアップロードする。
audio.mp3
). - "Transcribe audio: audio.mp3 with ElevenLabs "と入力してください。
- 書き起こされたテキストを返し、複数の話し手がいる場合は異なる話し手を認識する。
対話AI
- 探偵のように話し、映画の質問に答えるAIエージェントを作る。
- サーバーは、テキストや音声で対話できる音声エージェントを生成する。
音響処理
- 入力:"audio.mp3のバックグラウンドノイズから音声を分離する"。
- 処理されたオーディオファイルを返します。
デバッグとロギング
- ログの場所
- ウィンドウズ
%APPDATA%\Claude\logs\mcp-server-elevenlabs.log
- macOS。
~/Library/Logs/Claude/mcp-server-elevenlabs.log
- ウィンドウズ
- タイムアウトの問題:音声デザインのような操作は時間がかかるため、開発モードではタイムアウトすることがありますが、タスクは完了します。
一般的なエラーの解決
- "spawn uvx ENOENT"。
- プローブ
uvx
パスwhich uvx
- コンフィギュレーションを更新する。
"command": "/usr/local/bin/uvx"
.
- プローブ
アプリケーションシナリオ
- コンテンツ制作
- ポッドキャスト制作者は、音声合成を使ってナレーションを生成したり、自分の声をクローンして音声を大量に生成したりする。
- 教育とトレーニング
- 教師はレッスンテキストを音声に変換し、音声教材を作成する。
- 顧客サービス
- 企業は会話型AIを使用して、一般的な問い合わせに対応する音声カスタマーサービスを構築している。
- ゲーム開発
- 開発者は、没入感を高めるために、キャラクターにユニークな声を生成する。
品質保証
- 支払いは必要ですか?
- 無料会員は月10,000ポイントで、それ以上は有料会員になる必要がある。
- 対応言語は?
- 英語、中国語、その他の言語については、イレブンラボの公式ウェブサイトをご覧ください。
- 利用状況を確認する方法は?
- イレブンラボのウェブサイトにログインし、アカウントページでポイント消費をご覧ください。