Allgemeine Einführung
TextDistiller ist ein fortschrittliches, KI-gesteuertes Tool, das Bücher kapitelweise oder als Ganzes zusammenfasst und so einen prägnanten und dennoch umfassenden Überblick bietet. Durch den Einsatz von TextDistiller können die Nutzer die Kernideen und wichtigsten Punkte eines Buches schnell erfassen und so Zeit sparen, ohne den Inhalt zu vernachlässigen. Das Tool nutzt modernste Technologie zur Verarbeitung natürlicher Sprache, um sicherzustellen, dass die erstellten Zusammenfassungen sowohl genau als auch leicht zu lesen sind. Damit eignet es sich für alle, die schnell auf Informationen zu einem Buch zugreifen und diese verstehen müssen.
Funktionsliste
- kapitelweise ZusammenfassungBietet eine detaillierte Zusammenfassung jedes Kapitels, die es dem Benutzer erleichtert, sich auf den Inhalt eines bestimmten Kapitels zu konzentrieren.
- Überblick über das Buch: Geben Sie bei Büchern, die nicht in Kapitel unterteilt sind, eine komprimierte Zusammenfassung des Gesamtinhalts.
- Verarbeitung natürlicher Sprache (NLP)NLP-Technologie auf dem neuesten Stand der Technik, um die Genauigkeit und Lesbarkeit der Zusammenfassungen zu gewährleisten.
- benutzerfreundliche SchnittstelleEinfaches und intuitives Design der Benutzeroberfläche macht den Prozess der Zusammenfassung leicht nachvollziehbar.
Hilfe verwenden
Ablauf der Installation
- Klon-Lagerhaus:
git clone https://github.com/johngai19/TextDistiller.git
- Installieren Sie die erforderlichen Abhängigkeiten:
pip install -r anforderungen.txt
- Führen Sie die Befehlszeilenschnittstelle (CLI) aus:
python3 bsCLI.py --Pfad
- Starten Sie den Flask-Server und aktualisieren Sie die E-Mail-Konfiguration:
- Update
mail.py
den Nagel auf den Kopf treffenAbsender_Adresse
im Gesang antwortenabsender_pass
. - in Bewegung sein
views.py
::python3 ansichten.py
- Update
Verwendung Prozess
kapitelweise Zusammenfassung
- Übergeben Sie den Pfad zur Buch-PDF-Datei als Parameter an das Kommandozeilen-Tool.
- Das Tool unterteilt das Buch automatisch in einzelne Kapitel und erstellt eine detaillierte Zusammenfassung jedes Kapitels.
- Die Nutzer können sich den Kerninhalt jedes Kapitels ansehen und die wichtigsten Ideen des Buches schnell erfassen.
Überblick über das Buch
- Bei Büchern, die nicht in Kapitel unterteilt sind, behandelt das Tool das gesamte Buch als Ganzes.
- Die erstellte Zusammenfassung wird alle wichtigen Elemente des Buches abdecken und einen umfassenden Überblick geben.
Hauptfunktionen
- kapitelweise Zusammenfassung: Auf der Kommandozeile ausführen
python3 bsCLI.py --Pfad
Das Tool verarbeitet und erstellt automatisch eine Zusammenfassung jedes Kapitels. - Überblick über das BuchSie können die oben genannten Befehle auch von der Befehlszeile aus ausführen, und das Tool wählt automatisch die passende Behandlung auf der Grundlage der Struktur des Buches aus.
- Zusammenfassung anzeigenDie erzeugte Zusammenfassung wird als Textdatei im angegebenen Verzeichnis gespeichert, die vom Benutzer direkt geöffnet und angesehen werden kann.
Ausgewählte Funktionen
- Technologie zur Verarbeitung natürlicher Sprache (NLP)TextDistiller verwendet ein vortrainiertes T5-Modell, um sicherzustellen, dass die generierten Zusammenfassungen durch die Schritte Chunking, Tokenisierung, Generierung von Zusammenfassungen und Dekodierung sowohl genau als auch einfach zu lesen sind.
- benutzerfreundliche SchnittstelleTextDistiller bietet eine einfache und intuitive Oberfläche, die den Einstieg sowohl in das Kommandozeilentool als auch in den Flask-Server erleichtert.
Wie TextDistiller funktioniert
TextDistiller verwendet den HuggingFace Transformers'. T5-klein
Trainieren Sie das Modell vor, um genaue und lesbare Zusammenfassungen zu erstellen. Der Prozess umfasst:
- StückchenUnterteilen Sie das Buch in Abschnitte, entweder nach Kapiteln oder als Ganzes.
- Partizip: Verwendung
T5Tokenizer
Segmentieren Sie diese Blöcke, um sicherzustellen, dass sie mit demT5
Modell-Kompatibilität. - Abstrakte ErzeugungDer Text, der durch den Lexikalisierungsprozess verarbeitet wurde, wird durch die
T5ForConditionalGeneration
Das Modell erstellt eine Zusammenfassung der Token ID. - Decoder: Verwendung
T5Tokenizer
(in Form eines Nominalausdrucks)decodieren()
Funktion dekodiert die verdaute Token-ID in lesbaren Text.