Allgemeine Einführung
AI-reads-books-page-by-page ist ein intelligentes PDF-Buchanalysetool, das auf der Basis von Python entwickelt wurde. Es kann die seitenweise Analyse von PDF-Büchern automatisieren, wichtige Wissenspunkte extrahieren und nach bestimmten Seitenintervallen schrittweise Zusammenfassungen erstellen. Das Projekt nutzt KI-Technologie, um ein intelligentes Verständnis des Inhalts und die Generierung von Zusammenfassungen zu erreichen, was den Benutzern helfen kann, den Kerninhalt des Buches schnell zu erfassen. Das System verfügt über eine intelligente Filterfunktion, mit der Katalog- und Indexseiten automatisch übersprungen werden können, und unterstützt außerdem die Fortführung von Haltepunkten, so dass die Verarbeitung an der Stelle fortgesetzt werden kann, an der die letzte Analyse beendet wurde. Die Projektausgabe erfolgt im Markdown-Format, das einfach zu lesen und weiterzugeben ist, und unterstützt die dauerhafte Speicherung der Wissensbasis, um sicherzustellen, dass die Analyseergebnisse nicht verloren gehen.
Funktionsliste
- Automatisierung der PDF-Buchanalyse und Wissensextraktion
- KI-gesteuertes Verständnis von Inhalten und Erstellung von Zusammenfassungen
- Intervallbasierte Meilenstein-Fortschrittsübersichten
- Dauerhaftes Wissensdatenbank-Repository-System
- Zusammenfassende Ausgabe im Markdown-Format
- Farbiger Terminalausgang für bessere Sichtbarkeit
- Unterstützt das Lesen von Haltepunkten in bestehenden Wissensdatenbanken
- Konfigurierbare Analyseintervalle und Testmodi
- Intelligente Inhaltsfilterung (überspringt automatisch Inhaltsverzeichnisse, Indexseiten usw.)
- Strukturmanagement des geregelten Leistungskatalogs
- Speicherung der Wissensbasis im JSON-Format
- Unterstützung für die Auswahl benutzerdefinierter AI-Modelle
Hilfe verwenden
1. die Vorbereitung der Umwelt
- Stellen Sie zunächst sicher, dass Sie eine Python-Umgebung auf Ihrem System installiert haben.
- Klonen des Projekts auf lokaler Ebene:
git clone https://github.com/echohive42/AI-reads-books-page-by-page cd AI-liest-Bücher-Seitenweise
- Installieren Sie die Abhängigkeitspakete:
pip install -r anforderungen.txt
2. die Grundkonfiguration
Die folgenden Schlüsselparameter müssen vor der Verwendung konfiguriert werden:
- Legen Sie die zu analysierende PDF-Datei in das Stammverzeichnis des Projekts.
- zeigen (eine Eintrittskarte)
lese_bücher.py
ändern Sie die folgende Konfiguration:PDF_NAME
: Legen Sie den Namen der PDF-Datei als IhrenANALYSEN_INTERVALL
Einstellung des Analyseintervalls (Anzahl der Seiten)TEST_SEITEN
Einstellen der Anzahl der Testseiten (optional)MODELL
Auswahl von AI-Modellen für die Verarbeitung von SeitenANALYSE_MODELL
Auswahl von AI-Modellen für die Erstellung von Analysen
3. eine Beschreibung der Struktur des Katalogs
Das Programm erstellt automatisch die folgende Verzeichnisstruktur:
buch_analyse/wissen_basen/
Speicherung von Wissensdatenbankdateien im JSON-Formatbuch_auswertung/zusammenfassungen/
Speichern von Zusammenfassungsdateien im Markdown-Formatbuch_auswertung/pdfs/
Speichern von Kopien von PDF-Dateien
4. die Durchführung des Programms
python read_books.py
5. eine Beschreibung der Nutzung der erweiterten Funktionen
- Kontrolle der Intervallanalyse
- aufstellen
ANALYSIS_INTERVAL = Keine
Zusammenfassung der verschließbaren Intervalle - Wenn Sie einen bestimmten Wert (z. B. 20) festlegen, wird für jeweils 20 verarbeitete Seiten eine Zusammenfassung erstellt.
- aufstellen
- Testbild
- aufstellen
TEST_PAGES = Keine
Umgang mit ganzen Büchern - Die Festlegung einer bestimmten Anzahl von Seiten ermöglicht eine partielle Prüfung
- aufstellen
- Lesen Sie nach einer Pause weiter
- Das Programm speichert automatisch den Bearbeitungsfortschritt
- Beim Neustart des Programms wird es an der zuletzt bearbeiteten Position fortgesetzt.
- Verwaltung von Ausgabedateien
- Wissenspunkte werden in JSON-Dateien gespeichert
- Das zusammenfassende Dokument ist im Markdown-Format
- Dateinamen enthalten Zeitstempel zur Versionskontrolle
- Individuelle Analysen
- Einstellbare AI-Modellparameter
- Unterstützung bei der Konfiguration der Tiefe und Art der Analyse
- Ausgabeformat und Speicherort anpassbar
6. vorsichtsmaßnahmen
- Sicherstellen, dass PDF-Dateien korrekt formatiert sind, um Verschlüsselung oder Beschädigung zu vermeiden
- Bei der Verarbeitung großer PDF-Dateien wird ein Test im kleinen Rahmen empfohlen.
- Regelmäßige Sicherung der Dokumente der Wissensdatenbank
- Anpassung der Analyseintervalle an den tatsächlichen Bedarf
- Überwachung der Nutzung von Systemressourcen