ElevenLabs MCP: услуга Speech Generation MCP
Общее введение
ElevenLabsMCP ElevenLabs - официальный проект с открытым исходным кодом, размещенный на GitHub. Это серверный инструмент, основанный на протоколе Model Context Protocol (MCP) и предназначенный для соединения моделей ИИ с возможностями ElevenLabs по обработке речи и аудио. Инструмент позволяет пользователям преобразовывать текст в естественную речь, клонировать персонализированные голоса, транскрибировать аудио и даже создавать разговорные ИИ-агенты. Он поддерживает сотрудничество с Клод Клиентские интеграции, такие как Desktop, Cursor, Windsurf и другие, позволяют разработчикам запускать серверы локально и обрабатывать аудиозадачи через облачный API ElevenLabs. Бесплатный уровень проекта предлагает 10 000 кредитов в месяц для личного тестирования, в то время как платный план поддерживает более масштабное использование.

Список функций
- преобразование текста в речь: Превращайте текст в плавную, естественную речь, поддерживая широкий спектр тонов и языков.
- клонирование речи: Генерируйте уникальные звуки искусственного интеллекта из аудиообразцов.
- преобразование речи в текст:: Преобразование аудиофайлов в текст с поддержкой распознавания нескольких дикторов.
- Диалоговый искусственный интеллект:: Создание интеллектуальных агентов, которые могут общаться голосом и использоваться для исходящих звонков и т. д.
- обработка звука: Обеспечивает такие полезные функции, как звукоизоляция и улучшение качества звука.
- Поддержка локальных серверов: Запустите сервер на устройстве пользователя для подключения к облачному API.
Использование помощи
Процесс установки
Чтобы использовать ElevenLabs MCP, необходимо установить и настроить сервер локально. Ниже приведены подробные шаги:
- Подготовка среды
- Убедитесь, что на вашем компьютере установлен Python 3.8 или более поздней версии. Используйте команду
python --version
Проверьте версию. - Получите ключ API ElevenLabs. Доступ Официальный сайт ElevenLabsПосле регистрации найдите ключ на странице настроек.
- Рекомендуемая установка
uv
(Менеджер пакетов Python). Используйте командуcurl -LsSf https://astral.sh/uv/install.sh | sh
Установка, или см. УФ-склад.
- Убедитесь, что на вашем компьютере установлен Python 3.8 или более поздней версии. Используйте команду
- Скачать проект
- Откройте терминал и введите:
git clone https://github.com/elevenlabs/elevenlabs-mcp.git cd elevenlabs-mcp
- Откройте терминал и введите:
- Установка зависимостей
- расход или издержки
uv
Установка:uv pip install -r requirements.txt
- или по умолчанию
pip
::pip install -r requirements.txt
- расход или издержки
- Настройка ключей API
- Метод 1: Введите ключ во время выполнения программы:
python -m elevenlabs_mcp --api-key=你的API密钥
- Способ 2: Установка переменных окружения. Введите в терминале:
export ELEVENLABS_API_KEY=你的API密钥
Тогда бегите:
python -m elevenlabs_mcp
- Метод 1: Введите ключ во время выполнения программы:
- Запустите сервер
- По умолчанию используется адрес
http://127.0.0.1:8000
. Если существует конфликт портов, используйте--port
Модификация:python -m elevenlabs_mcp --port=8080
- По умолчанию используется адрес
- Подключение клиентов
- Claude Desktop
- Откройте Claude Desktop и нажмите на Меню > Справка > Включить режим разработчика в левом верхнем углу (пользователям Windows необходимо его включить).
- Чтобы добавить конфигурацию, перейдите в меню Настройки > Разработчик > Редактировать конфигурацию:
{ "mcpServers": { "ElevenLabs": { "command": "uvx", "args": ["elevenlabs-mcp"], "env": { "ELEVENLABS_API_KEY": "你的API密钥" } } } }
- Сохраните и перезапустите Claude.
- Другие клиенты (например, Cursor, Windsurf)
- Установите пакет:
pip install elevenlabs-mcp
- Запустите его и получите конфигурацию:
python -m elevenlabs_mcp --api-key=你的API密钥 --print
- Вставьте выходную конфигурацию в указанный каталог на клиенте.
- Установите пакет:
- Claude Desktop
Функции Поток операций
преобразование текста в речь
- Введите в Claude: "Сгенерируйте речь: 'Hello, I'm ElevenLabs' с помощью ElevenLabs".
- Сервер генерирует аудио и возвращает его, Claude воспроизводит его автоматически. Можно задать мелодию, например, "голос: Адам".
клонирование речи
- Подготовьте 2-3 чистых аудиообразца (например.
sample.wav
). - Введите: "Клонировать голос с [sample.wav]".
- Сервер возвращает идентификатор голоса, который используется для генерации нового голоса.
преобразование речи в текст
- Загрузите аудиофайл (например.
audio.mp3
). - Введите "Транскрибировать аудио: audio.mp3 с помощью ElevenLabs".
- Возвращает расшифрованный текст и распознает разных дикторов, если их несколько.
Диалоговый искусственный интеллект
- Введите: "Создайте ИИ-агента, который говорит как детектив и отвечает на вопросы по фильмам".
- Сервер генерирует агентов с речью, с которыми можно взаимодействовать с помощью текста или голоса.
обработка звука
- Введите: "Изолировать голос от фонового шума в файле audio.mp3".
- Возвращает обработанный аудиофайл.
Отладка и ведение журнала
- Местонахождение журнала:
- Окна.
%APPDATA%\Claude\logs\mcp-server-elevenlabs.log
- macOS.
~/Library/Logs/Claude/mcp-server-elevenlabs.log
- Окна.
- Проблемы с тайм-аутом: такие операции, как разработка голоса, занимают много времени, и в режиме разработки может возникнуть тайм-аут, но задача все равно будет выполнена.
Решение распространенных ошибок
- "spawn uvx ENOENT".
- зонд
uvx
Путь:which uvx
- Обновите конфигурацию, например.
"command": "/usr/local/bin/uvx"
.
- зонд
сценарий применения
- создание контента
- Производители подкастов используют преобразование текста в речь для создания дикторского текста или клонируют собственные голоса для массового производства аудио.
- Образование и обучение
- Преподаватели преобразуют текст урока в речь, чтобы создать аудиоматериалы для обучения.
- обслуживание клиентов
- Предприятия используют разговорный ИИ для создания голосовой службы поддержки клиентов, чтобы обрабатывать обычные запросы.
- разработка игр
- Разработчики генерируют уникальные голоса для персонажей, чтобы усилить погружение в игру.
QA
- Нужно ли мне платить?
- Бесплатный уровень предлагает 10 000 баллов в месяц, после чего необходимо приобрести платный тарифный план.
- Какие языки поддерживаются?
- Поддерживаются английский, китайский и другие языки, см. официальный сайт ElevenLabs.
- Как проверить использование?
- Войдите на сайт ElevenLabs и просмотрите расход баллов на странице вашей учетной записи.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...