ElevenLabs MCP: услуга Speech Generation MCP

Общее введение

ElevenLabsMCP ElevenLabs - официальный проект с открытым исходным кодом, размещенный на GitHub. Это серверный инструмент, основанный на протоколе Model Context Protocol (MCP) и предназначенный для соединения моделей ИИ с возможностями ElevenLabs по обработке речи и аудио. Инструмент позволяет пользователям преобразовывать текст в естественную речь, клонировать персонализированные голоса, транскрибировать аудио и даже создавать разговорные ИИ-агенты. Он поддерживает сотрудничество с Клод Клиентские интеграции, такие как Desktop, Cursor, Windsurf и другие, позволяют разработчикам запускать серверы локально и обрабатывать аудиозадачи через облачный API ElevenLabs. Бесплатный уровень проекта предлагает 10 000 кредитов в месяц для личного тестирования, в то время как платный план поддерживает более масштабное использование.

ElevenLabs MCP:语音生成MCP服务

 

Список функций

  • преобразование текста в речь: Превращайте текст в плавную, естественную речь, поддерживая широкий спектр тонов и языков.
  • клонирование речи: Генерируйте уникальные звуки искусственного интеллекта из аудиообразцов.
  • преобразование речи в текст:: Преобразование аудиофайлов в текст с поддержкой распознавания нескольких дикторов.
  • Диалоговый искусственный интеллект:: Создание интеллектуальных агентов, которые могут общаться голосом и использоваться для исходящих звонков и т. д.
  • обработка звука: Обеспечивает такие полезные функции, как звукоизоляция и улучшение качества звука.
  • Поддержка локальных серверов: Запустите сервер на устройстве пользователя для подключения к облачному API.

 

Использование помощи

Процесс установки

Чтобы использовать ElevenLabs MCP, необходимо установить и настроить сервер локально. Ниже приведены подробные шаги:

  1. Подготовка среды
    • Убедитесь, что на вашем компьютере установлен Python 3.8 или более поздней версии. Используйте команду python --version Проверьте версию.
    • Получите ключ API ElevenLabs. Доступ Официальный сайт ElevenLabsПосле регистрации найдите ключ на странице настроек.
    • Рекомендуемая установка uv(Менеджер пакетов Python). Используйте команду curl -LsSf https://astral.sh/uv/install.sh | sh Установка, или см. УФ-склад.
  2. Скачать проект
    • Откройте терминал и введите:
      git clone https://github.com/elevenlabs/elevenlabs-mcp.git
      cd elevenlabs-mcp
      
  3. Установка зависимостей
    • расход или издержки uv Установка:
      uv pip install -r requirements.txt
      
    • или по умолчанию pip::
      pip install -r requirements.txt
      
  4. Настройка ключей API
    • Метод 1: Введите ключ во время выполнения программы:
      python -m elevenlabs_mcp --api-key=你的API密钥
      
    • Способ 2: Установка переменных окружения. Введите в терминале:
      export ELEVENLABS_API_KEY=你的API密钥
      

      Тогда бегите:

      python -m elevenlabs_mcp
      
  5. Запустите сервер
    • По умолчанию используется адрес http://127.0.0.1:8000. Если существует конфликт портов, используйте --port Модификация:
      python -m elevenlabs_mcp --port=8080
      
  6. Подключение клиентов
    • Claude Desktop
      • Откройте Claude Desktop и нажмите на Меню > Справка > Включить режим разработчика в левом верхнем углу (пользователям Windows необходимо его включить).
      • Чтобы добавить конфигурацию, перейдите в меню Настройки > Разработчик > Редактировать конфигурацию:
        {
        "mcpServers": {
        "ElevenLabs": {
        "command": "uvx",
        "args": ["elevenlabs-mcp"],
        "env": {
        "ELEVENLABS_API_KEY": "你的API密钥"
        }
        }
        }
        }
        
      • Сохраните и перезапустите Claude.
    • Другие клиенты (например, Cursor, Windsurf)
      • Установите пакет:
        pip install elevenlabs-mcp
        
      • Запустите его и получите конфигурацию:
        python -m elevenlabs_mcp --api-key=你的API密钥 --print
        
      • Вставьте выходную конфигурацию в указанный каталог на клиенте.

Функции Поток операций

преобразование текста в речь

  • Введите в Claude: "Сгенерируйте речь: 'Hello, I'm ElevenLabs' с помощью ElevenLabs".
  • Сервер генерирует аудио и возвращает его, Claude воспроизводит его автоматически. Можно задать мелодию, например, "голос: Адам".

клонирование речи

  • Подготовьте 2-3 чистых аудиообразца (например. sample.wav).
  • Введите: "Клонировать голос с [sample.wav]".
  • Сервер возвращает идентификатор голоса, который используется для генерации нового голоса.

преобразование речи в текст

  • Загрузите аудиофайл (например. audio.mp3).
  • Введите "Транскрибировать аудио: audio.mp3 с помощью ElevenLabs".
  • Возвращает расшифрованный текст и распознает разных дикторов, если их несколько.

Диалоговый искусственный интеллект

  • Введите: "Создайте ИИ-агента, который говорит как детектив и отвечает на вопросы по фильмам".
  • Сервер генерирует агентов с речью, с которыми можно взаимодействовать с помощью текста или голоса.

обработка звука

  • Введите: "Изолировать голос от фонового шума в файле audio.mp3".
  • Возвращает обработанный аудиофайл.

Отладка и ведение журнала

  • Местонахождение журнала:
    • Окна. %APPDATA%\Claude\logs\mcp-server-elevenlabs.log
    • macOS. ~/Library/Logs/Claude/mcp-server-elevenlabs.log
  • Проблемы с тайм-аутом: такие операции, как разработка голоса, занимают много времени, и в режиме разработки может возникнуть тайм-аут, но задача все равно будет выполнена.

Решение распространенных ошибок

  • "spawn uvx ENOENT".
    • зонд uvx Путь:
      which uvx
      
    • Обновите конфигурацию, например. "command": "/usr/local/bin/uvx".

 

сценарий применения

  1. создание контента
    • Производители подкастов используют преобразование текста в речь для создания дикторского текста или клонируют собственные голоса для массового производства аудио.
  2. Образование и обучение
    • Преподаватели преобразуют текст урока в речь, чтобы создать аудиоматериалы для обучения.
  3. обслуживание клиентов
    • Предприятия используют разговорный ИИ для создания голосовой службы поддержки клиентов, чтобы обрабатывать обычные запросы.
  4. разработка игр
    • Разработчики генерируют уникальные голоса для персонажей, чтобы усилить погружение в игру.

 

QA

  1. Нужно ли мне платить?
    • Бесплатный уровень предлагает 10 000 баллов в месяц, после чего необходимо приобрести платный тарифный план.
  2. Какие языки поддерживаются?
    • Поддерживаются английский, китайский и другие языки, см. официальный сайт ElevenLabs.
  3. Как проверить использование?
    • Войдите на сайт ElevenLabs и просмотрите расход баллов на странице вашей учетной записи.
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...