Clone Voice: Многоязычный инструмент для клонирования голоса без сэмплов на основе xtts_v2 для Windows.

Общее введение

Clone Voice - это инструмент клонирования звука с открытым исходным кодом, который предоставляет веб-интерфейс, позволяющий пользователям клонировать голоса, используя любой звук или личную запись голоса. Инструмент прост в использовании и может быть запущен локально с помощью предварительно скомпилированного приложения даже без NVIDIA GPU. Он поддерживает множество языков, в том числе 16 языков, таких как китайский, английский, японский, корейский, французский, немецкий и итальянский. Пользователи могут записывать звук через микрофон или загружать аудиофайлы для конвертации.

Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

 

Список функций

  • Текст в звук: введите текст или импортируйте файлы субтитров, чтобы сгенерировать речь с заданным тембром.
  • Звук в звук: загружайте аудиофайлы или записывайте звук онлайн, конвертируйте в заданные тона.
  • Многоязыковая поддержка: поддерживает синтез и преобразование речи на 16 языках.
  • Простота использования: не требуется NVIDIA GPU, загрузите предварительно скомпилированную версию и используйте ее.
  • Онлайн-запись: запись звука через микрофон для преобразования в реальном времени.
  • Загрузка моделей: предоставляет различные варианты загрузки моделей для удовлетворения различных потребностей.

 

Использование помощи

Процесс установки

  1. Загрузите предварительно скомпилированную версию окна (в других системах может быть развернут исходный код)
    • интервью Страница релизов Загрузите последнюю предварительно скомпилированную версию и файлы модели.
    • Загрузите и распакуйте его в указанную директорию, например E:/clone-voice.
  2. Запуск приложения::
    • двойной щелчок app.exeВеб-интерфейс открывается автоматически.
    • Внимательно читайте подсказки в окне CMD, любые ошибки будут отображаться здесь.
  3. Конфигурация модели::
    • Распакуйте загруженные файлы моделей в каталог программного обеспечения под папкой tts Внутри папки.

Процесс использования

  1. преобразование текста в звук::
    • Выберите кнопку [Текст->Звук] и введите текст в текстовое поле или нажмите кнопку , чтобы импортировать файл субтитров.
    • Выберите тональность, которую вы хотите использовать, и нажмите кнопку "Начать сейчас", чтобы сгенерировать голосовой файл.
  2. Звук к звуку::
    • Выберите кнопку [Звук->Звук], чтобы загрузить аудиофайл для преобразования (поддерживается формат mp3/wav/flac).
    • Выберите тембр, который вы хотите клонировать, в раскрывающемся окне "Звуковой файл для использования" или нажмите кнопку "Локальная загрузка", чтобы выбрать записанный звуковой файл.
    • Нажмите кнопку "Начать сейчас", чтобы сгенерировать преобразованный аудиофайл.
  3. Онлайн-запись::
    • Нажмите кнопку "Начать запись", чтобы записать 5-20 секунд звука через микрофон.
    • Нажмите кнопку "Использовать" после записи, чтобы преобразовать звук.

Развертывание исходного кода (для Linux, Mac, Windows)

  1. Конфигурация среды::
    • Установите Python 3.9 или выше и инструмент git-cmd.
    • Создайте виртуальную среду и активируйте ее:python -m venv venv(математика) родsource venv/bin/activate(Linux/Mac) или venv\Scripts\activate(Windows).
  2. Загрузить исходный код::
    • Откройте окно CMD в целевом каталоге и выполните команду git clone https://github.com/jianchang512/clone-voice.git.
  3. Установка зависимостей::
    • осуществлять pip install -r requirements.txt Установите необходимые зависимости.
    • Если требуется ускорение CUDA, удалите существующий факел и переустановите версию с поддержкой CUDA:pip uninstall -y torch(математика) родpip install torch torchaudio --index-url https://download.pytorch.org/whl/cu121.
  4. Запуск приложения::
    • осуществлять python app.py Запустите веб-интерфейс.
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...