LiberSonora: Extracción de subtítulos de audiolibros y traducción multilingüe, transcripción de audiolibros a varios idiomas

Últimos recursos sobre IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

49.4K 00

Introducción general

LiberSonora, que significa "sonido libre", es un potente conjunto de herramientas de código abierto para audiolibros que permite la extracción inteligente de subtítulos, la generación de títulos mediante IA y la traducción multilingüe con aceleración por GPU. LiberSonora está diseñado para proporcionar a los usuarios una experiencia de producción de audiolibros eficiente y cómoda a través de un diseño modular y una personalización flexible. Tanto los usuarios particulares como las empresas pueden crear y gestionar fácilmente contenidos de audiolibros con LiberSonora.

Lista de funciones

Extracción inteligente de subtítulos: Extrae automáticamente los subtítulos del audio y admite varios idiomas.
Generación de títulos AIGenerar titulares adecuados en función del contenido para aumentar su atractivo.
traducción multilingüe: Admite traducciones a varios idiomas para usuarios de todo el mundo.
Aceleración GPU: Procesamiento acelerado mediante GPU para mejorar la eficiencia del procesamiento.
Procesamiento offline por lotes: Admite el procesamiento por lotes de archivos de audio, funciona sin conexión y protege la privacidad del usuario.
Diseño modularLos usuarios pueden seleccionar y personalizar los módulos funcionales en función de sus necesidades.
Personalización flexible: Ayudar a los usuarios a personalizar y ampliar las funciones en función de sus necesidades específicas.

Utilizar la ayuda

Proceso de instalación

Preparación medioambiental::
- Asegúrate de tener instalados Git y Python 3.8 o superior.
- Instale las bibliotecas de dependencias necesarias:pip install -r requirements.txt.
almacén de clones::

   git clone https://github.com/LiberSonora/LiberSonora.git
cd LiberSonora

Entorno de configuración::
- Modifique el archivo de configuración según sea necesarioconfig.yaml, configurar la aceleración de la GPU, las opciones de idioma y otros parámetros.
programa de carrera::

   python main.py

Función Flujo de operaciones

Extracción inteligente de subtítulos::
- Coloca el archivo de audio en el directorio especificado.
- Ejecute el módulo de extracción de subtítulos:python extract_subtitles.py --input_dir ./audio_files --output_dir ./subtitles.
- Los archivos de subtítulos extraídos se guardarán en la carpeta./subtitlesCatálogo.
Generación de títulos AI::
- Ejecute el módulo de generación de títulos:python generate_titles.py --input_dir ./subtitles --output_dir ./titles.
- El archivo de cabecera generado se guardará en la carpeta./titlesCatálogo.
traducción multilingüe::
- Ejecute el módulo de traducción:python translate.py --input_dir ./subtitles --output_dir ./translated_subtitles --target_lang zh.
- Los archivos de subtítulos traducidos se guardarán en la carpeta./translated_subtitlesCatálogo.
Procesamiento offline por lotes::
- Coloca varios archivos de audio en el directorio especificado.
- Ejecute el script de procesamiento por lotes:python batch_process.py --input_dir ./audio_files --output_dir ./processed_files.
- El archivo procesado se guardará en la carpeta./processed_filesCatálogo.
Diseño modular y personalización flexible::
- Los usuarios pueden modificar y ampliar el código de cada módulo según sus necesidades.
- Consulte la documentación del proyecto y el código de ejemplo para personalizar y ampliar las funciones.