Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife

Local-NotebookLM: PDF local para gerar podcasts de voz de ferramentas de código aberto

Introdução geral

O Local-NotebookLM é um projeto de código aberto que visa fornecer ferramentas inteligentes de processamento de documentos e geração de conteúdo executadas localmente. Ele está sujeito ao Google NotebookLM O projeto é inspirado no trabalho de Gökdeniz Gülmez e se concentra em ajudar os usuários a converter documentos, como PDFs, em vários formatos de saída, como podcasts, entrevistas ou palestras, além de oferecer suporte à implantação local para garantir a privacidade dos dados. O desenvolvedor, Gökdeniz Gülmez, mantém o projeto no GitHub, fornecendo etapas e instruções claras de instalação. Com suporte para documentos complexos, como artigos acadêmicos, com até 100.000 palavras, e chunking inteligente, o projeto é ideal para usuários que precisam analisar documentos com eficiência ou gerar conteúdo criativo. Seja você um estudante, pesquisador ou criador de conteúdo, é fácil converter documentos em áudio ou se expressar em vários modos. Local-NotebookLM: PDF localizado para gerar podcasts de voz de ferramentas de código aberto-1

 

Lista de funções

  • Processamento inteligente de documentosExtração automática de texto em PDF, limpeza de erros de formatação, suporte a trabalhos acadêmicos que contêm fórmulas matemáticas.
  • Separação inteligenteDivisão de arquivos grandes em segmentos gerenciáveis, suportando documentos de até 100.000 palavras.
  • Geração de conteúdo multimodal: 15 formatos de saída estão disponíveis, incluindo podcasts, entrevistas, debates, palestras e muito mais.
  • Suporte ao tempo de execução localNão há necessidade de depender de serviços em nuvem, todo o processamento é feito no dispositivo do usuário, garantindo a segurança dos dados.
  • Código aberto e gratuitoO código está disponível publicamente no GitHub e os usuários podem fazer download, modificar e contribuir.

 

Usando a Ajuda

Processo de instalação

Para usar o Local-NotebookLM localmente, você precisa seguir as etapas abaixo para configurar seu ambiente e executar o projeto. Abaixo está um guia de instalação detalhado para garantir que você comece a trabalhar rapidamente.

1. clonagem de armazéns

Primeiro, verifique se o Git está instalado no seu dispositivo. Abra um terminal (Prompt de Comando ou PowerShell para usuários do Windows) e digite o seguinte comando para clonar o projeto localmente:

git clone https://github.com/Goekdeniz-Guelmez/Local-NotebookLM.git

Quando terminar, vá para o catálogo de projetos:

cd Local-NotebookLM

2. criação de ambientes virtuais

Para evitar conflitos de dependência, é recomendável usar um ambiente virtual Python. Execute o seguinte comando para criá-lo e ativá-lo:

  • Linux/macOS::
python -m venv venv
source venv/bin/activate
  • Windows (computador)::
python -m venv venv
venv\Scripts\activate

Após a ativação, o prompt do terminal será precedido por (venv)indicando que o ambiente virtual foi acessado.

3. instalação de dependências

As dependências do projeto estão listadas em requirements.txt arquivo. Execute o seguinte comando para instalar todas as bibliotecas necessárias:

pip install -r requirements.txt

O processo de instalação pode levar alguns minutos, dependendo da velocidade da rede. Após a conclusão, o pip list Verifique se a instalação foi bem-sucedida.

4. executar o projeto

Após a conclusão da instalação, execute o arquivo do programa principal diretamente (supondo que o arquivo main.py(O nome exato do arquivo é baseado na versão mais recente do GitHub):


python main.py

Se tudo correr bem, o programa será iniciado e você poderá começar a usar o Local-NotebookLM.

Como usar os principais recursos

O núcleo do Local-NotebookLM está no processamento de documentos e na geração de conteúdo, e as etapas específicas são as seguintes.

Função 1: Processamento inteligente de documentos

  1. Carregar arquivos PDF::
    • Prepare um arquivo PDF (por exemplo, um artigo acadêmico ou relatório) e coloque-o na pasta especificada no diretório do projeto (ou diretamente no diretório raiz, se não for explicitamente indicado).
    • Digite o caminho do arquivo na interface do programa (ou na linha de comando, dependendo da versão), por exemplo:input.pdf.
  2. Extração e limpeza de texto::
    • O programa extrai automaticamente o texto do PDF e remove quebras de linha, espaços ou erros de formatação extras.
    • Para documentos que contêm fórmulas matemáticas, a ferramenta tentará preservar a estrutura das fórmulas para garantir a integridade do conteúdo.
  3. Visualização de resultados::
    • O texto processado é salvo como um arquivo de texto simples (por exemplo output.txt), ou exibido diretamente na interface para a próxima etapa.

Função 2: Agrupamento inteligente

  • Cenários aplicáveisQuando um PDF carregado ultrapassa vários milhares de palavras, o programa o divide automaticamente em pedaços.
  • procedimento::
    1. Especifique os parâmetros de divisão em blocos (por exemplo, 5000 palavras por bloco) ao executar o programa. exemplo de comando:
      python main.py --chunk-size 5000 input.pdf
      
    2. O conteúdo em blocos é salvo em ordem como vários arquivos (por exemplo chunk1.txtechunk2.txt) para facilitar o acompanhamento.
  • advertênciaSuporte máximo para 100.000 palavras; se o arquivo for muito grande, é recomendável dividi-lo com antecedência.

Função 3: Geração de conteúdo multimodo

  1. Selecionar formato de saída::
    • O programa suporta 15 modos, como podcasts, entrevistas, etc. O tempo de execução é especificado por parâmetros, por exemplo
      python main.py --mode podcast input.txt
      
  2. Gerar conteúdo::
    • O programa gera conteúdo no formato correspondente com base no texto extraído, por exemplo, o modo podcast simulará um diálogo entre duas pessoas.
    • Os resultados gerados geralmente são salvos como arquivos de áudio (por exemplo output.mp3) ou scripts de texto (como script.txt).
  3. Reproduzir ou editar::
    • Use qualquer reprodutor de áudio (por exemplo, VLC) para abrir o arquivo gerado .mp3 ou ajuste o script com um editor de texto e gere-o novamente.

Dicas e precauções de operação

  • Requisitos ambientaisVerifique se a versão do Python é 3.8 ou superior; o ffmpeg é recomendado (para processamento de áudio) e está disponível para usuários do Linux. sudo apt install ffmpegSe você for um usuário do Windows, precisará fazer download e configurar as variáveis de ambiente.
  • caminho do arquivoEvite usar caminhos chineses ao inserir caminhos de arquivos para evitar erros de codificação.
  • Problemas de depuraçãoSe você receber um erro, verifique se a dependência está totalmente instalada ou consulte a página de problemas do GitHub para obter ajuda da comunidade.
  • Funcionalidade estendidaOs usuários familiarizados com programação podem modificar o código para adicionar formatos de saída personalizados, e a natureza de código aberto do projeto oferece possibilidades ilimitadas para isso.

Com essas etapas, você pode converter facilmente documentos PDF em podcasts ou outras formas de conteúdo e desfrutar de uma experiência de processamento inteligente e localizada. Seja para pesquisa acadêmica ou geração de ideias, o Local-NotebookLM pode ser o seu braço direito.

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Local-NotebookLM: PDF local para gerar podcasts de voz de ferramentas de código aberto
pt_BRPortuguês do Brasil