Voice-Pro: herramienta de traducción de vídeo multifuncional de código abierto, transcripción y traducción de voz a varios idiomas, instalación de Windows con un solo clic.
Últimos recursos sobre IAPublicado hace 9 meses Círculo de intercambio de inteligencia artificial 3.2K 00
Introducción general
Voice-Pro es una herramienta multifuncional basada en Gradio WebUI que admite voz a texto, texto a voz, traducción en tiempo real, descarga de vídeos de YouTube y separación de voz humana. Integra las tecnologías Whisper, Faster-Whisper y Whisper-Timestamped para ofrecer un procesamiento de audio y una traducción eficientes para múltiples idiomas y escenarios.


Lista de funciones
- voz a texto: Admite Whisper, Faster-Whisper y Whisper-Timestamped, lo que proporciona un reconocimiento de voz de gran precisión.
- texto a vozCompatibilidad con Edge-TTS y F5-TTS, con múltiples idiomas y opciones de voz, y compatibilidad con ajustes de velocidad, volumen y tono.
- traducción en tiempo real: Admite el reconocimiento de voz en tiempo real y la traducción a varios idiomas.
- YouTube Descargar: Puedes descargar vídeos de YouTube y extraer audio (mp3, wav, flac).
- separación vocal: Separación de sonidos vocales y de fondo mediante los motores MDX-Net y Demucs.
- archivo por lotes: Admite la generación de subtítulos, la traducción y el procesamiento de texto a voz de grandes lotes de archivos.
- Generación de subtítulos: Admite la generación y edición de subtítulos en más de 90 idiomas.
- Soporte multiformato: Se admiten todos los formatos de vídeo y audio compatibles con ffmpeg.
Utilizar la ayuda
Proceso de instalación
- paquete de inicioClone o descargue la última versión del código fuente de GitHub.
git clone https://github.com/abus-aikorea/voice-pro.git
- Instalar y ejecutar el programa::
- estar en movimiento
configure.bat
Instale las dependencias necesarias (por ejemplo, git, ffmpeg y CUDA). - estar en movimiento
start.bat
Inicia Voice-Pro y WebUI se ejecutará automáticamente. - Cuando se ejecute por primera vez, Voice-Pro se instalará primero, lo que puede tardar una hora o más, tiempo durante el cual no cierre la ventana de comandos de Windows.
- estar en movimiento
Funciones de uso
- voz a texto::
- En la pestaña Estudio, seleccione Susurro Modelos y tipos de cálculo.
- Carga un archivo de audio o selecciona una fuente de entrada de audio (como un micrófono).
- Haz clic en el botón "Iniciar" y espera a que finalice el reconocimiento de voz y la creación de subtítulos.
- renderización::
- Cargue los archivos de texto o subtítulos que desea traducir en la pestaña Traducir.
- Seleccione el idioma de destino y haga clic en el botón "Traducir".
- Una vez finalizada la traducción, podrá descargar el archivo traducido.
- texto a voz::
- Seleccione Edge-TTS o F5-TTS en la pestaña TTS.
- Introduzca el texto que desea convertir y seleccione los parámetros de voz (velocidad, volumen, tono, etc.).
- Haga clic en el botón "Generar voz" y espere a que se complete la generación de voz.
- YouTube Descargar::
- Introduce el enlace del vídeo de YouTube en la pestaña YouTube Downloader.
- Selecciona el formato de audio (mp3, wav, flac) y haz clic en el botón "Descargar".
- Una vez finalizada la descarga, encontrarás el archivo de audio en la carpeta especificada.
- separación acústica::
- Cargue archivos de audio en la pestaña Vocal Remover.
- Seleccione el motor MDX-Net o Demucs y haga clic en el botón Iniciar.
- Espera a que se complete la separación del sonido y podrás descargar el archivo de audio separado.
- archivo por lotes::
- Cargue varios archivos en la pestaña Lote.
- Seleccione la operación deseada (subtitulación, traducción, texto a voz).
- Haga clic en el botón "Iniciar" y espere a que finalice el procesamiento por lotes.
problemas comunes
- El navegador no se ejecuta automáticamenteCierra la ventana de comandos de Windows y vuelve a ejecutar
start.bat
o introduzca manualmente la dirección mostrada en su navegador (por ejemplo, http://127.0.0.1:7892). - Error de memoria insuficiente en CUDA: Compruebe el estado de la memoria de la GPU y ajuste el nivel de reducción de ruido o el tipo de cálculo.
- Advertencia de Windows DefenderAñada el archivo por lotes como excepción o desactive temporalmente Windows Defender.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...