TextDistiller : résumez un livre entier en un clic, distillez efficacement le contenu du livre et saisissez rapidement les idées essentielles.

Dernières ressources sur l'IAPosté il y a 10 mois Cercle de partage de l'IA

18.1K 00

Introduction générale

TextDistiller est un outil avancé basé sur l'intelligence artificielle, conçu pour résumer des livres chapitre par chapitre ou dans leur ensemble, en fournissant une vue d'ensemble à la fois concise et complète. En utilisant TextDistiller, les utilisateurs sont en mesure de saisir rapidement les idées essentielles et les points clés de n'importe quel livre, ce qui leur permet de gagner du temps tout en conservant une bonne compréhension du contenu. L'outil utilise une technologie de pointe en matière de traitement du langage naturel pour garantir que les résumés générés sont à la fois précis et faciles à lire, ce qui le rend adapté à ceux qui ont besoin d'accéder rapidement à des informations sur un livre et de les comprendre.

Liste des fonctions

résumé chapitre par chapitreLa version anglaise de l'ouvrage : fournit un résumé détaillé de chaque chapitre, ce qui permet aux utilisateurs de se concentrer sur le contenu d'un chapitre spécifique.
Aperçu du livreLes livres qui ne sont pas divisés en chapitres peuvent faire l'objet d'un résumé condensé de l'ensemble du contenu.
le traitement du langage naturel (NLP)La technologie NLP de pointe est utilisée pour garantir l'exactitude et la lisibilité du contenu des résumés.
interface convivialeL'interface est simple et intuitive, ce qui rend le processus de résumé facile à suivre.

Utiliser l'aide

Processus d'installation

Entrepôt de clonage :git clone https://github.com/johngai19/TextDistiller.git
Installer les dépendances nécessaires :pip install -r requirements.txt
Exécutez l'interface de ligne de commande (CLI) :python3 bsCLI.py --path <path-to-PDF-file>
Exécutez le serveur Flask et mettez à jour la configuration du courrier :
- mise à jour mail.py a fait mouche sender_address répondre en chantant sender_pass.
- être en mouvement views.py: :python3 views.py

Processus d'utilisation

résumé chapitre par chapitre

Transmettre le chemin d'accès au fichier PDF du livre comme paramètre à l'outil de ligne de commande.
L'outil découpe automatiquement le livre par chapitre et génère un résumé détaillé de chaque chapitre.
Les utilisateurs peuvent visualiser le contenu essentiel de chaque chapitre et saisir rapidement les idées principales du livre.

Aperçu du livre

Pour les livres qui ne sont pas divisés en chapitres, l'outil traite l'ensemble du livre comme un tout.
Le résumé généré couvrira tous les éléments importants du livre, offrant ainsi une vue d'ensemble.

Principales fonctions

résumé chapitre par chapitreExécuter sur la ligne de commande python3 bsCLI.py --path <path-to-PDF-file>L'outil traite et génère automatiquement un résumé de chaque chapitre.
Aperçu du livreL'outil sélectionnera automatiquement le traitement approprié en fonction de la structure du livre.
Voir le résuméLe résumé généré sera sauvegardé sous forme de fichier texte dans le répertoire spécifié, qui pourra être ouvert et visualisé directement par l'utilisateur.

Fonctions vedettes

la technologie de traitement du langage naturel (NLP)TextDistiller utilise un modèle pré-entraîné T5-small pour garantir que les résumés générés sont à la fois précis et faciles à lire à travers les étapes de découpage, de tokenisation, de génération de résumés et de décodage.
interface convivialeTextDistiller offre une interface simple et intuitive qui facilite la prise en main de l'outil en ligne de commande et du serveur Flask.

Fonctionnement de TextDistiller

TextDistiller utilise les transformateurs HuggingFace'. T5-small Pré-entraîner le modèle à générer des résumés précis et lisibles. Le processus comprend

morceauLe livre : Divisez le livre en plusieurs parties, soit par chapitre, soit dans son ensemble.
participe: Utilisation T5Tokenizer Segmenter ces blocs pour s'assurer qu'ils sont cohérents avec les T5 Compatibilité des modèles.
Génération abstraiteLe texte qui a été traité par le lexique passe par la fonction T5ForConditionalGeneration Le modèle génère un résumé des Jeton ID.
décodeur: Utilisation T5Tokenizer (utilisé comme expression nominale) decode() décode le Token ID digéré en texte lisible.