Voice-Pro: многофункциональный инструмент для перевода видео с открытым исходным кодом, транскрипция и перевод голоса на множество языков, установка Windows одним щелчком мыши
Общее введение
Voice-Pro - это многофункциональный инструмент на базе Gradio WebUI, который поддерживает преобразование речи в текст, текст в речь, перевод в реальном времени, загрузку видео с YouTube и разделение человеческого голоса. В нем интегрированы технологии Whisper, Faster-Whisper и Whisper-Timestamped, обеспечивающие эффективную обработку звука и перевод для множества языков и сценариев.


Список функций
- преобразование речи в текст: Поддерживает функции Whisper, Faster-Whisper и Whisper-Timestamped, обеспечивая высокую точность распознавания речи.
- преобразование текста в речьПоддержка Edge-TTS и F5-TTS, несколько вариантов языка и голоса, а также поддержка регулировки скорости, громкости и высоты тона.
- перевод в реальном времени: Поддержка распознавания речи в реальном времени и перевода на несколько языков.
- YouTube Скачать: Вы можете загружать видео с YouTube и извлекать аудио (mp3, wav, flac).
- разделение голоса: Разделение вокальных и фоновых звуков с помощью движков MDX-Net и Demucs.
- пакетный файл: Поддержка создания субтитров, перевода и преобразования текста в речь при обработке больших партий файлов.
- Поколение субтитров: Поддерживает создание и редактирование субтитров на более чем 90 языках.
- Поддержка нескольких форматов: Поддерживаются все видео- и аудиоформаты, поддерживаемые ffmpeg.
Использование помощи
Процесс установки
- стартовый пакет: Клонируйте или загрузите последнюю версию исходного кода с GitHub.
git clone https://github.com/abus-aikorea/voice-pro.git
- Установите и запустите программу::
- быть в движении
configure.bat
Установите необходимые зависимости (например, git, ffmpeg и CUDA). - быть в движении
start.bat
Запустите Voice-Pro, и WebUI запустится автоматически. - При первом запуске Voice-Pro сначала установится, что может занять час или более, и в это время не закрывайте командное окно Windows.
- быть в движении
Функции использования
- преобразование речи в текст::
- На вкладке Студия выберите Шепот Модели и виды расчетов.
- Загрузите аудиофайл или выберите источник входного аудиосигнала (например, микрофон).
- Нажмите кнопку "Начать" и дождитесь завершения процесса распознавания речи и создания субтитров.
- рендеринг::
- Загрузите файлы текста или субтитров для перевода на вкладке "Перевод".
- Выберите целевой язык и нажмите кнопку "Перевести".
- После завершения перевода вы можете загрузить переведенный файл.
- преобразование текста в речь::
- Выберите Edge-TTS или F5-TTS на вкладке TTS.
- Введите текст для преобразования и выберите параметры голоса (например, скорость, громкость, высоту тона).
- Нажмите кнопку "Генерировать голос" и дождитесь завершения генерации голоса.
- YouTube Скачать::
- Введите ссылку на видео с YouTube на вкладке YouTube Downloader.
- Выберите формат аудио (mp3, wav, flac) и нажмите кнопку "Загрузить".
- После завершения загрузки вы найдете аудиофайл в указанной папке.
- разделение звуков::
- Загрузите аудиофайлы на вкладке Vocal Remover.
- Выберите движок MDX-Net или Demucs и нажмите кнопку Start.
- Дождитесь завершения разделения звука и загрузите разделенный аудиофайл.
- пакетный файл::
- Загрузите несколько файлов на вкладке Пакетная загрузка.
- Выберите нужную операцию (субтитры, перевод, преобразование текста в речь).
- Нажмите кнопку "Начать" и дождитесь завершения пакетной обработки.
общие проблемы
- Браузер не запускается автоматически: Закройте командное окно Windows и запустите его снова.
start.bat
, или вручную введите отображаемый адрес в браузере (например, http://127.0.0.1:7892). - Ошибка отсутствия памяти в CUDA: Проверьте состояние памяти GPU и настройте уровень шумоподавления или тип вычислений.
- Предупреждение Защитника Windows: Добавьте пакетный файл в исключения или временно отключите Защитник Windows.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...