Voice-Pro: herramienta de traducción de vídeo multifuncional de código abierto, transcripción y traducción de voz a varios idiomas, instalación de Windows con un solo clic.

Introducción general

Voice-Pro es una herramienta multifuncional basada en Gradio WebUI que admite voz a texto, texto a voz, traducción en tiempo real, descarga de vídeos de YouTube y separación de voz humana. Integra las tecnologías Whisper, Faster-Whisper y Whisper-Timestamped para ofrecer un procesamiento de audio y una traducción eficientes para múltiples idiomas y escenarios.

Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

 

Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

 

Lista de funciones

  • voz a texto: Admite Whisper, Faster-Whisper y Whisper-Timestamped, lo que proporciona un reconocimiento de voz de gran precisión.
  • texto a vozCompatibilidad con Edge-TTS y F5-TTS, con múltiples idiomas y opciones de voz, y compatibilidad con ajustes de velocidad, volumen y tono.
  • traducción en tiempo real: Admite el reconocimiento de voz en tiempo real y la traducción a varios idiomas.
  • YouTube Descargar: Puedes descargar vídeos de YouTube y extraer audio (mp3, wav, flac).
  • separación vocal: Separación de sonidos vocales y de fondo mediante los motores MDX-Net y Demucs.
  • archivo por lotes: Admite la generación de subtítulos, la traducción y el procesamiento de texto a voz de grandes lotes de archivos.
  • Generación de subtítulos: Admite la generación y edición de subtítulos en más de 90 idiomas.
  • Soporte multiformato: Se admiten todos los formatos de vídeo y audio compatibles con ffmpeg.

 

Utilizar la ayuda

Proceso de instalación

  1. paquete de inicioClone o descargue la última versión del código fuente de GitHub.
    git clone https://github.com/abus-aikorea/voice-pro.git
  1. Instalar y ejecutar el programa::
    • estar en movimiento configure.bat Instale las dependencias necesarias (por ejemplo, git, ffmpeg y CUDA).
    • estar en movimiento start.bat Inicia Voice-Pro y WebUI se ejecutará automáticamente.
    • Cuando se ejecute por primera vez, Voice-Pro se instalará primero, lo que puede tardar una hora o más, tiempo durante el cual no cierre la ventana de comandos de Windows.

Funciones de uso

  1. voz a texto::
    • En la pestaña Estudio, seleccione Susurro Modelos y tipos de cálculo.
    • Carga un archivo de audio o selecciona una fuente de entrada de audio (como un micrófono).
    • Haz clic en el botón "Iniciar" y espera a que finalice el reconocimiento de voz y la creación de subtítulos.
  2. renderización::
    • Cargue los archivos de texto o subtítulos que desea traducir en la pestaña Traducir.
    • Seleccione el idioma de destino y haga clic en el botón "Traducir".
    • Una vez finalizada la traducción, podrá descargar el archivo traducido.
  3. texto a voz::
    • Seleccione Edge-TTS o F5-TTS en la pestaña TTS.
    • Introduzca el texto que desea convertir y seleccione los parámetros de voz (velocidad, volumen, tono, etc.).
    • Haga clic en el botón "Generar voz" y espere a que se complete la generación de voz.
  4. YouTube Descargar::
    • Introduce el enlace del vídeo de YouTube en la pestaña YouTube Downloader.
    • Selecciona el formato de audio (mp3, wav, flac) y haz clic en el botón "Descargar".
    • Una vez finalizada la descarga, encontrarás el archivo de audio en la carpeta especificada.
  5. separación acústica::
    • Cargue archivos de audio en la pestaña Vocal Remover.
    • Seleccione el motor MDX-Net o Demucs y haga clic en el botón Iniciar.
    • Espera a que se complete la separación del sonido y podrás descargar el archivo de audio separado.
  6. archivo por lotes::
    • Cargue varios archivos en la pestaña Lote.
    • Seleccione la operación deseada (subtitulación, traducción, texto a voz).
    • Haga clic en el botón "Iniciar" y espere a que finalice el procesamiento por lotes.

problemas comunes

  • El navegador no se ejecuta automáticamenteCierra la ventana de comandos de Windows y vuelve a ejecutar start.bato introduzca manualmente la dirección mostrada en su navegador (por ejemplo, http://127.0.0.1:7892).
  • Error de memoria insuficiente en CUDA: Compruebe el estado de la memoria de la GPU y ajuste el nivel de reducción de ruido o el tipo de cálculo.
  • Advertencia de Windows DefenderAñada el archivo por lotes como excepción o desactive temporalmente Windows Defender.
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...