Introdução geral
O LiberSonora, que significa "som livre", é um poderoso conjunto de ferramentas de audiolivro de código aberto habilitado para IA que oferece suporte à extração inteligente de legendas, geração de títulos com IA e tradução em vários idiomas com aceleração de GPU. O conjunto de ferramentas é compatível com extração inteligente de legendas, geração de títulos com IA, tradução em vários idiomas, etc., e é capaz de processar off-line em lote com aceleração de GPU. O LiberSonora foi projetado para oferecer aos usuários uma experiência de produção de audiolivros eficiente e conveniente por meio de um design modular e personalização flexível. Usuários individuais e corporativos podem criar e gerenciar facilmente o conteúdo de audiolivros com o LiberSonora.
Lista de funções
- Extração inteligente de legendasLegendas: extrai automaticamente as legendas do áudio e oferece suporte a vários idiomas.
- Geração de títulos com IAGerar manchetes apropriadas com base no conteúdo para aumentar seu apelo.
- tradução multilíngueSuporte a traduções em vários idiomas para usuários globais.
- Aceleração de GPUProcessamento acelerado usando GPUs para melhorar a eficiência do processamento.
- Processamento off-line em loteSuporte ao processamento em lote de arquivos de áudio, execução off-line e proteção da privacidade do usuário.
- Design modularOs usuários podem selecionar e personalizar módulos funcionais de acordo com suas necessidades.
- Personalização flexívelSuporte aos usuários para que personalizem e ampliem a funcionalidade de acordo com suas necessidades específicas.
Usando a Ajuda
Processo de instalação
- Preparação ambiental::
- Certifique-se de que você tenha o Git e o Python 3.8 ou superior instalados.
- Instale as bibliotecas de dependência necessárias:
pip install -r requirements.txt
.
- armazém de clones::
git clone https://github.com/LiberSonora/LiberSonora.git
cd LiberSonora
- Ambiente de configuração::
- Modifique o arquivo de configuração conforme necessário
config.yaml
Defina a aceleração da GPU, as opções de idioma e outros parâmetros.
- Modifique o arquivo de configuração conforme necessário
- programa de corrida::
python main.py
Função Fluxo de operação
- Extração inteligente de legendas::
- Coloca o arquivo de áudio no diretório especificado.
- Execute o módulo de extração de legendas:
python extract_subtitles.py --input_dir . /audio_files --output_dir . /subtitles
. - Os arquivos de legenda extraídos serão salvos na pasta
. /subtitles
Catálogo.
- Geração de títulos com IA::
- Execute o módulo de geração de títulos:
python generate_titles.py --input_dir . /subtitles --output_dir . /titles
. - O arquivo de cabeçalho gerado será salvo na pasta
. /títulos
Catálogo.
- Execute o módulo de geração de títulos:
- tradução multilíngue::
- Execute o módulo de tradução:
python translate.py --input_dir . /subtitles --output_dir . /translated_subtitles ---target_lang zh
. - Os arquivos de legenda traduzidos serão salvos na pasta
. /translated_subtitles
Catálogo.
- Execute o módulo de tradução:
- Processamento off-line em lote::
- Coloca vários arquivos de áudio no diretório especificado.
- Execute o script de processamento em lote:
python batch_process.py --input_dir . /audio_files --output_dir . /arquivos_processados
. - O arquivo processado será salvo na pasta
. /files_processados
Catálogo.
- Design modular e personalização flexível::
- Os usuários podem modificar e estender o código de cada módulo de acordo com suas necessidades.
- Consulte a documentação do projeto e o código de amostra para personalização de recursos e extensões.