Allgemeine Einführung
Öffnen Sie NotebookLM ist ein Open-Source-Projekt zur Umwandlung beliebiger PDF-Dokumente in einen Podcast. Das Tool verwendet quelloffene Large Language Models (LLM) und Text-to-Speech (TTS)-Modelle, um PDF-Inhalte zu verarbeiten, natürliche Dialoge zu generieren, die für Audio-Podcasts geeignet sind, und sie in MP3-Dateien auszugeben. Inspiriert durch das NotebookLM-Tool, nutzt das Projekt Technologien wie Llama 3.3 70B, Fireworks AI, MeloTTS, Bark und Jina Reader. Benutzer können PDF-Dokumente über eine einfache Schnittstelle hochladen, um informative und interessante Podcast-Dialoge zu erstellen.
Funktionsliste
- PDF zu PodcastHochladen eines PDF-Dokuments, um dessen Inhalt in einen Podcast-Dialog zu konvertieren.
- Natürliche DialoggenerierungErstellen Sie informative Dialoge, die sowohl lehrreich als auch unterhaltsam sein sollen.
- benutzerfreundliche SchnittstelleGradio: Verwenden Sie Gradio, um eine einfache interaktive Schnittstelle bereitzustellen.
- Mehrsprachige UnterstützungPodcast-Erstellung in 13 Sprachen wird unterstützt.
Hilfe verwenden
Ablauf der Installation
- Klon-Lagerhaus:
git clone https://github.com/gabrielchua/open-notebooklm.git
cd open-notebooklm
- Erstellen Sie eine virtuelle Umgebung und aktivieren Sie sie:
python -m venv .venv
Quelle .venv/bin/activate
- Installieren Sie die erforderlichen Pakete:
pip install -r anforderungen.txt
Verwendung Prozess
- Legen Sie den API-Schlüssel fest:
- Festlegen des Fireworks-API-Schlüssels als Umgebungsvariable
FEUERWERK_API_SCHLÜSSEL
.
- Festlegen des Fireworks-API-Schlüssels als Umgebungsvariable
- Führen Sie die Anwendung aus:
python app.py
Dadurch wird die Gradio-Schnittstelle gestartet.
- PDF hochladen:
- Laden Sie das PDF-Dokument, das Sie in einen Podcast umwandeln möchten, in die Schnittstelle hoch.
- Erzeugen Sie Audio:
- Klicken Sie auf die Schaltfläche, um den Konvertierungsprozess zu starten. Die Ausgabe ist eine MP3-Datei, die den Podcast-Dialog enthält.
Detaillierte Funktionsabläufe
- PDF-UploadPDF-Dateien in der Gradio-Oberfläche auswählen und hochladen.
- Erzeugung von DialogenDas System verarbeitet automatisch PDF-Inhalte, um einen natürlichen Dialog zu erzeugen.
- AudioausgangKlicken Sie auf die Schaltfläche Erzeugen und das System wird die Podcast-Datei im MP3-Format ausgeben.
- Mehrsprachige UnterstützungWählen Sie in den Einstellungen die gewünschte Sprache aus, und das System erstellt den Podcast in der entsprechenden Sprache entsprechend der Auswahl.