AI Personal Learning
und praktische Anleitung
讯飞绘镜

Open NotebookLM: PDF in Podcasts von Open-Source-Tools konvertieren

Allgemeine Einführung

Öffnen Sie NotebookLM ist ein Open-Source-Projekt zur Umwandlung beliebiger PDF-Dokumente in einen Podcast. Das Tool verwendet quelloffene Large Language Models (LLM) und Text-to-Speech (TTS)-Modelle, um PDF-Inhalte zu verarbeiten, natürliche Dialoge zu generieren, die für Audio-Podcasts geeignet sind, und sie in MP3-Dateien auszugeben. Inspiriert durch das NotebookLM-Tool, nutzt das Projekt Technologien wie Llama 3.3 70B, Fireworks AI, MeloTTS, Bark und Jina Reader. Benutzer können PDF-Dokumente über eine einfache Schnittstelle hochladen, um informative und interessante Podcast-Dialoge zu erstellen.

Open NotebookLM:将PDF转换为播客的开源工具-1


 

Funktionsliste

  • PDF zu PodcastHochladen eines PDF-Dokuments, um dessen Inhalt in einen Podcast-Dialog zu konvertieren.
  • Natürliche DialoggenerierungErstellen Sie informative Dialoge, die sowohl lehrreich als auch unterhaltsam sein sollen.
  • benutzerfreundliche SchnittstelleGradio: Verwenden Sie Gradio, um eine einfache interaktive Schnittstelle bereitzustellen.
  • Unterstützung mehrerer SprachenPodcast-Erstellung in 13 Sprachen wird unterstützt.

 

Hilfe verwenden

Einbauverfahren

  1. Klon-Lagerhaus:
   git clone https://github.com/gabrielchua/open-notebooklm.git
cd open-notebooklm
  1. Erstellen Sie eine virtuelle Umgebung und aktivieren Sie sie:
   python -m venv .venv
source .venv/bin/activate
  1. Installieren Sie die erforderlichen Pakete:
   pip install -r requirements.txt

Verwendungsprozess

  1. Legen Sie den API-Schlüssel fest:
    • Festlegen des Fireworks-API-Schlüssels als UmgebungsvariableFIREWORKS_API_KEY.
  2. Führen Sie die Anwendung aus:
   python app.py

Dadurch wird die Gradio-Schnittstelle gestartet.

  1. PDF hochladen:
    • Laden Sie das PDF-Dokument, das Sie in einen Podcast umwandeln möchten, in die Schnittstelle hoch.
  2. Erzeugen Sie Audio:
    • Klicken Sie auf die Schaltfläche, um den Konvertierungsprozess zu starten. Die Ausgabe ist eine MP3-Datei, die den Podcast-Dialog enthält.

Detaillierte Funktionsabläufe

  1. PDF-UploadPDF-Dateien in der Gradio-Oberfläche auswählen und hochladen.
  2. Erzeugung von DialogenDas System verarbeitet automatisch PDF-Inhalte, um einen natürlichen Dialog zu erzeugen.
  3. AudioausgangKlicken Sie auf die Schaltfläche Erzeugen und das System wird die Podcast-Datei im MP3-Format ausgeben.
  4. Unterstützung mehrerer SprachenWählen Sie in den Einstellungen die gewünschte Sprache aus, und das System erstellt den Podcast in der entsprechenden Sprache entsprechend der Auswahl.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " Open NotebookLM: PDF in Podcasts von Open-Source-Tools konvertieren
de_DEDeutsch