LiberSonora: extração de legendas de audiolivros e tradução multilíngue, transcrição de audiolivros em vários idiomas

Recursos mais recentes de IAPublicado há 7 meses Círculo de compartilhamento de IA

18.3K 00

Introdução geral

O LiberSonora, que significa "som livre", é um poderoso conjunto de ferramentas de audiolivro de código aberto habilitado para IA que oferece suporte à extração inteligente de legendas, geração de títulos com IA e tradução em vários idiomas com aceleração de GPU. O conjunto de ferramentas é compatível com extração inteligente de legendas, geração de títulos com IA, tradução em vários idiomas, etc., e é capaz de processar off-line em lote com aceleração de GPU. O LiberSonora foi projetado para oferecer aos usuários uma experiência de produção de audiolivros eficiente e conveniente por meio de um design modular e personalização flexível. Usuários individuais e corporativos podem criar e gerenciar facilmente o conteúdo de audiolivros com o LiberSonora.

Lista de funções

Extração inteligente de legendasLegendas: extrai automaticamente as legendas do áudio e oferece suporte a vários idiomas.
Geração de títulos com IAGerar manchetes apropriadas com base no conteúdo para aumentar seu apelo.
tradução multilíngueSuporte a traduções em vários idiomas para usuários globais.
Aceleração de GPUProcessamento acelerado usando GPUs para melhorar a eficiência do processamento.
Processamento off-line em loteSuporte ao processamento em lote de arquivos de áudio, execução off-line e proteção da privacidade do usuário.
Design modularOs usuários podem selecionar e personalizar módulos funcionais de acordo com suas necessidades.
Personalização flexívelSuporte aos usuários para que personalizem e ampliem a funcionalidade de acordo com suas necessidades específicas.

Usando a Ajuda

Processo de instalação

Preparação ambiental::
- Certifique-se de que você tenha o Git e o Python 3.8 ou superior instalados.
- Instale as bibliotecas de dependência necessárias:pip install -r requirements.txt.
armazém de clones::

   git clone https://github.com/LiberSonora/LiberSonora.git
cd LiberSonora

Ambiente de configuração::
- Modifique o arquivo de configuração conforme necessárioconfig.yamlDefina a aceleração da GPU, as opções de idioma e outros parâmetros.
programa de corrida::

   python main.py

Função Fluxo de operação

Extração inteligente de legendas::
- Coloca o arquivo de áudio no diretório especificado.
- Execute o módulo de extração de legendas:python extract_subtitles.py --input_dir ./audio_files --output_dir ./subtitles.
- Os arquivos de legenda extraídos serão salvos na pasta./subtitlesCatálogo.
Geração de títulos com IA::
- Execute o módulo de geração de títulos:python generate_titles.py --input_dir ./subtitles --output_dir ./titles.
- O arquivo de cabeçalho gerado será salvo na pasta./titlesCatálogo.
tradução multilíngue::
- Execute o módulo de tradução:python translate.py --input_dir ./subtitles --output_dir ./translated_subtitles --target_lang zh.
- Os arquivos de legenda traduzidos serão salvos na pasta./translated_subtitlesCatálogo.
Processamento off-line em lote::
- Coloca vários arquivos de áudio no diretório especificado.
- Execute o script de processamento em lote:python batch_process.py --input_dir ./audio_files --output_dir ./processed_files.
- O arquivo processado será salvo na pasta./processed_filesCatálogo.
Design modular e personalização flexível::
- Os usuários podem modificar e estender o código de cada módulo de acordo com suas necessidades.
- Consulte a documentação do projeto e o código de amostra para personalização de recursos e extensões.