LiberSonora: Extracción de subtítulos de audiolibros y traducción multilingüe, transcripción de audiolibros a varios idiomas
Últimos recursos sobre IAPublicado hace 6 meses Círculo de intercambio de inteligencia artificial 1.6K 00
Introducción general
LiberSonora, que significa "sonido libre", es un potente conjunto de herramientas de código abierto para audiolibros que permite la extracción inteligente de subtítulos, la generación de títulos mediante IA y la traducción multilingüe con aceleración por GPU. LiberSonora está diseñado para proporcionar a los usuarios una experiencia de producción de audiolibros eficiente y cómoda a través de un diseño modular y una personalización flexible. Tanto los usuarios particulares como las empresas pueden crear y gestionar fácilmente contenidos de audiolibros con LiberSonora.

Lista de funciones
- Extracción inteligente de subtítulos: Extrae automáticamente los subtítulos del audio y admite varios idiomas.
- Generación de títulos AIGenerar titulares adecuados en función del contenido para aumentar su atractivo.
- traducción multilingüe: Admite traducciones a varios idiomas para usuarios de todo el mundo.
- Aceleración GPU: Procesamiento acelerado mediante GPU para mejorar la eficiencia del procesamiento.
- Procesamiento offline por lotes: Admite el procesamiento por lotes de archivos de audio, funciona sin conexión y protege la privacidad del usuario.
- Diseño modularLos usuarios pueden seleccionar y personalizar los módulos funcionales en función de sus necesidades.
- Personalización flexible: Ayudar a los usuarios a personalizar y ampliar las funciones en función de sus necesidades específicas.
Utilizar la ayuda
Proceso de instalación
- Preparación medioambiental::
- Asegúrate de tener instalados Git y Python 3.8 o superior.
- Instale las bibliotecas de dependencias necesarias:
pip install -r requirements.txt
.
- almacén de clones::
git clone https://github.com/LiberSonora/LiberSonora.git
cd LiberSonora
- Entorno de configuración::
- Modifique el archivo de configuración según sea necesario
config.yaml
, configurar la aceleración de la GPU, las opciones de idioma y otros parámetros.
- Modifique el archivo de configuración según sea necesario
- programa de carrera::
python main.py
Función Flujo de operaciones
- Extracción inteligente de subtítulos::
- Coloca el archivo de audio en el directorio especificado.
- Ejecute el módulo de extracción de subtítulos:
python extract_subtitles.py --input_dir ./audio_files --output_dir ./subtitles
. - Los archivos de subtítulos extraídos se guardarán en la carpeta
./subtitles
Catálogo.
- Generación de títulos AI::
- Ejecute el módulo de generación de títulos:
python generate_titles.py --input_dir ./subtitles --output_dir ./titles
. - El archivo de cabecera generado se guardará en la carpeta
./titles
Catálogo.
- Ejecute el módulo de generación de títulos:
- traducción multilingüe::
- Ejecute el módulo de traducción:
python translate.py --input_dir ./subtitles --output_dir ./translated_subtitles --target_lang zh
. - Los archivos de subtítulos traducidos se guardarán en la carpeta
./translated_subtitles
Catálogo.
- Ejecute el módulo de traducción:
- Procesamiento offline por lotes::
- Coloca varios archivos de audio en el directorio especificado.
- Ejecute el script de procesamiento por lotes:
python batch_process.py --input_dir ./audio_files --output_dir ./processed_files
. - El archivo procesado se guardará en la carpeta
./processed_files
Catálogo.
- Diseño modular y personalización flexible::
- Los usuarios pueden modificar y ampliar el código de cada módulo según sus necesidades.
- Consulte la documentación del proyecto y el código de ejemplo para personalizar y ampliar las funciones.
© declaración de copyright
El artículo está protegido por derechos de autor y no debe reproducirse sin autorización.
Artículos relacionados
Sin comentarios...