Allgemeine Einführung
Local-NotebookLM ist ein Open-Source-Projekt, das darauf abzielt, lokal ausgeführte intelligente Dokumentverarbeitungs- und Inhaltserstellungswerkzeuge bereitzustellen. Es unterliegt Google NotebookLM Das Projekt ist von der Arbeit von Gökdeniz Gülmez inspiriert und konzentriert sich darauf, Benutzern bei der Konvertierung von Dokumenten wie PDFs in eine Vielzahl von Ausgabeformaten wie Podcasts, Interviews oder Vorlesungen zu helfen und gleichzeitig die lokale Bereitstellung zu unterstützen, um den Datenschutz zu gewährleisten. Der Entwickler, Gökdeniz Gülmez, pflegt das Projekt auf GitHub und bietet klare Installationsschritte und -anweisungen. Mit der Unterstützung für komplexe Dokumente wie akademische Arbeiten mit bis zu 100.000 Wörtern und intelligentem Chunking ist das Projekt ideal für Benutzer, die Dokumente effizient analysieren oder kreative Inhalte erstellen müssen. Egal, ob Sie Student, Forscher oder Inhaltsersteller sind, es ist einfach, Dokumente in Audio zu konvertieren oder sich in verschiedenen Modi auszudrücken.
Funktionsliste
- Intelligente DokumentenverarbeitungAutomatisches Extrahieren von PDF-Text, Bereinigung von Formatierungsfehlern, Unterstützung für wissenschaftliche Arbeiten mit mathematischen Formeln.
- Intelligentes ChunkingTeilt große Dateien in überschaubare Segmente und unterstützt Dokumente mit bis zu 100.000 Wörtern.
- Multimodale Inhaltserstellung15 Ausgabeformate stehen zur Verfügung, darunter Podcasts, Interviews, Debatten, Vorträge und mehr.
- Lokale LaufzeitunterstützungDie gesamte Verarbeitung findet auf dem Gerät des Nutzers statt, wodurch die Datensicherheit gewährleistet ist.
- Quelloffen und kostenlosDer Code ist auf GitHub öffentlich zugänglich und kann von den Nutzern heruntergeladen, verändert und weiterentwickelt werden.
Hilfe verwenden
Ablauf der Installation
Um Local-NotebookLM lokal zu verwenden, müssen Sie die folgenden Schritte ausführen, um Ihre Umgebung zu konfigurieren und das Projekt zu starten. Nachfolgend finden Sie eine detaillierte Installationsanleitung, damit Sie schnell loslegen können.
1. das Klonen von Lagern
Stellen Sie zunächst sicher, dass Git auf Ihrem Gerät installiert ist. Öffnen Sie ein Terminal (Eingabeaufforderung oder PowerShell für Windows-Nutzer) und geben Sie den folgenden Befehl ein, um das Projekt lokal zu klonen:
git clone https://github.com/Goekdeniz-Guelmez/Local-NotebookLM.git
Wenn Sie fertig sind, gehen Sie zum Projektkatalog:
cd Lokales-NotebookLM
2. die Schaffung von virtuellen Umgebungen
Um Abhängigkeitskonflikte zu vermeiden, empfiehlt es sich, eine virtuelle Python-Umgebung zu verwenden. Führen Sie den folgenden Befehl aus, um sie zu erstellen und zu aktivieren:
- Linux/macOS::
python -m venv venv
Quelle venv/bin/activate
- Windows (Computer)::
python -m venv venv
venv\Scripts\aktivieren
Nach der Aktivierung erscheint vor dem Terminalprompt die Meldung (venv)
und zeigt damit an, dass die virtuelle Umgebung betreten wurde.
3. die Installation von Abhängigkeiten
Die Projektabhängigkeiten sind aufgelistet in Anforderungen.txt
Datei. Führen Sie den folgenden Befehl aus, um alle erforderlichen Bibliotheken zu installieren:
pip install -r anforderungen.txt
Der Installationsvorgang kann je nach Netzwerkgeschwindigkeit einige Minuten dauern. Sobald er abgeschlossen ist, wird die Pip-Liste
Prüfen Sie, ob die Installation erfolgreich war.
4. die Durchführung des Projekts
Nachdem die Installation abgeschlossen ist, führen Sie die Hauptprogrammdatei direkt aus (vorausgesetzt, die main.py
(Der genaue Dateiname basiert auf der neuesten Version von GitHub):
python main.py
Wenn alles gut geht, wird das Programm gestartet und Sie können Local-NotebookLM verwenden.
Verwendung der wichtigsten Funktionen
Der Kern von Local-NotebookLM liegt in der Verarbeitung von Dokumenten und der Generierung von Inhalten, und die folgenden Schritte sind spezifisch.
Funktion 1: Intelligente Dokumentenverarbeitung
- Hochladen von PDF-Dateien::
- Bereiten Sie eine PDF-Datei vor (z. B. eine wissenschaftliche Arbeit oder einen Bericht) und legen Sie sie in dem angegebenen Ordner im Projektverzeichnis ab (oder direkt im Stammverzeichnis, falls nicht ausdrücklich angegeben).
- Geben Sie den Dateipfad in der Programmoberfläche (oder in der Befehlszeile, je nach Version) ein, zum Beispiel:
Eingabe.pdf
.
- Textextraktion und -bereinigung::
- Das Programm extrahiert automatisch den Text aus der PDF-Datei und entfernt zusätzliche Zeilenumbrüche, Leerzeichen oder Formatierungsfehler.
- Bei Dokumenten, die mathematische Formeln enthalten, versucht das Tool, die Struktur der Formeln zu erhalten, um die Integrität des Inhalts zu gewährleisten.
- Ergebnisse Ansicht::
- Der verarbeitete Text wird als reine Textdatei gespeichert (z. B.
output.txt
), oder direkt in der Schnittstelle für den nächsten Schritt angezeigt.
- Der verarbeitete Text wird als reine Textdatei gespeichert (z. B.
Funktion 2: Intelligentes Chunking
- Anwendbare SzenarienWenn eine hochgeladene PDF-Datei mehrere tausend Wörter überschreitet, wird sie vom Programm automatisch in Teile zerlegt.
- Verfahren::
- Geben Sie die Chunking-Parameter (z. B. 5000 Wörter pro Chunk) an, wenn Sie das Programm ausführen. Beispielbefehl:
python main.py --chunk-size 5000 input.pdf
- Der gechunkte Inhalt wird der Reihe nach als mehrere Dateien gespeichert (z. B.
stück1.txt
, undchunk2.txt
) zur einfachen Nachverfolgung.
- Geben Sie die Chunking-Parameter (z. B. 5000 Wörter pro Chunk) an, wenn Sie das Programm ausführen. Beispielbefehl:
- caveatMaximale Unterstützung für 100.000 Wörter, wenn die Datei zu groß ist, wird empfohlen, sie im Voraus aufzuteilen.
Funktion 3: Multimodale Inhaltserstellung
- Ausgabeformat wählen::
- Das Programm unterstützt 15 Modi, z. B. Podcasts, Interviews usw. Die Laufzeit wird durch Parameter festgelegt, z. B:
python main.py --mode podcast input.txt
- Das Programm unterstützt 15 Modi, z. B. Podcasts, Interviews usw. Die Laufzeit wird durch Parameter festgelegt, z. B:
- Inhalte generieren::
- Aus dem extrahierten Text generiert das Programm Inhalte im entsprechenden Format, z.B. wird im Podcast-Modus ein Zweipersonendialog simuliert.
- Die erzeugten Ergebnisse werden in der Regel als Audiodateien gespeichert (z. B.
Ausgabe.mp3
) oder Text-Skripte (wie z.B.skript.txt
).
- Abspielen oder Bearbeiten::
- Verwenden Sie einen beliebigen Audioplayer (z. B. VLC), um die erzeugte Datei zu öffnen.
.mp3
Datei, oder passen Sie das Skript mit einem Texteditor an und generieren Sie es neu.
- Verwenden Sie einen beliebigen Audioplayer (z. B. VLC), um die erzeugte Datei zu öffnen.
Tipps und Vorsichtsmaßnahmen zur Bedienung
- Anforderungen an die UmweltVergewissern Sie sich, dass die Python-Version 3.8 oder höher ist, ffmpeg wird empfohlen (für die Audioverarbeitung) und ist für Linux-Benutzer verfügbar.
sudo apt install ffmpeg
Wenn Sie ein Windows-Benutzer sind, müssen Sie die Umgebungsvariablen herunterladen und konfigurieren. - DateipfadVermeiden Sie die Verwendung chinesischer Pfade bei der Eingabe von Dateipfaden, um Kodierungsfehler zu vermeiden.
- Debugging-ProblemeWenn Sie eine Fehlermeldung erhalten, überprüfen Sie, ob die Abhängigkeit vollständig installiert ist, oder schauen Sie auf der GitHub Issues-Seite nach, um Hilfe von der Community zu erhalten.
- Erweiterte FunktionalitätBenutzer, die mit der Programmierung vertraut sind, können den Code ändern, um benutzerdefinierte Ausgabeformate hinzuzufügen, und der Open-Source-Charakter des Projekts bietet dafür unbegrenzte Möglichkeiten.
Mit diesen Schritten können Sie ganz einfach PDF-Dokumente in Podcasts oder andere Formen von Inhalten umwandeln und eine lokalisierte, intelligente Verarbeitung genießen. Ob es sich um akademische Forschung oder Ideenfindung handelt, Local-NotebookLM kann Ihre rechte Hand sein.