Introdução geral
Aberto NotebookLM é um projeto de código aberto desenvolvido para converter qualquer documento PDF em um podcast. A ferramenta usa modelos de código aberto LLM (Large Language Models) e TTS (Text-to-Speech) para processar o conteúdo do PDF, gerar diálogos naturais adequados para podcasts de áudio e gerar arquivos MP3. Inspirado na ferramenta NotebookLM, o projeto usa tecnologias como Llama 3.3 70B, Fireworks AI, MeloTTS, Bark e Jina Reader. Os usuários podem carregar documentos PDF por meio de uma interface simples para gerar diálogos de podcast informativos e interessantes.
Lista de funções
- PDF para PodcastCarregar um documento PDF para converter seu conteúdo em um diálogo de podcast.
- Geração de diálogo naturalGeração de diálogos informativos projetados para serem educativos e divertidos.
- Interface amigávelUse o Gradio para fornecer uma interface interativa simples.
- Suporte a vários idiomasGeração de podcasts em 13 idiomas: há suporte para a geração de podcasts em 13 idiomas.
Usando a Ajuda
Processo de instalação
- Armazém de Clonagem:
git clone https://github.com/gabrielchua/open-notebooklm.git
cd open-notebooklm
- Crie um ambiente virtual e ative-o:
python -m venv .venv
fonte .venv/bin/activate
- Instale os pacotes necessários:
pip install -r requirements.txt
Processo de uso
- Defina a chave da API:
- Definição da chave da API do Fireworks como uma variável de ambiente
FIREWORKS_API_KEY
.
- Definição da chave da API do Fireworks como uma variável de ambiente
- Execute o aplicativo:
python app.py
Isso abrirá a interface do Gradio.
- Carregar PDF:
- Carregue o documento PDF que você deseja converter em um podcast na interface.
- Gerar áudio:
- Clique no botão para iniciar o processo de conversão e o resultado será um arquivo MP3 contendo o diálogo do podcast.
Fluxo de operação detalhado da função
- Carregamento de PDFSelecione e carregue arquivos PDF na interface do Gradio.
- Geração de diálogoO sistema processará automaticamente o conteúdo do PDF para gerar um diálogo natural.
- saída de áudioClique no botão Generate (Gerar) e o sistema produzirá o arquivo de podcast no formato MP3.
- Suporte a vários idiomasIdioma: Selecione o idioma desejado nas configurações e o sistema gerará o podcast no idioma apropriado, de acordo com a seleção.