Mad Professor : un outil d'IA pour aider à la lecture et à l'analyse d'articles académiques
Introduction générale
Mad Professor (暴躁的教授读论文) est un outil académique IA open source conçu pour les chercheurs et les étudiants afin de simplifier la lecture et l'analyse d'articles académiques. Il intègre le traitement des PDF, la traduction par l'IA, la recherche RAG, les questions-réponses par l'IA et l'interaction vocale. Les utilisateurs peuvent importer des documents PDF et l'outil extraira automatiquement le contenu, traduira et générera un texte structuré qui pourra être lu en chinois et en anglais. Mad Professor aide les utilisateurs à comprendre rapidement le contenu des articles grâce à des questions-réponses intelligentes et à l'interaction vocale. Il propose également une interface à écran partagé, affichant l'article à gauche et le dialogue AI à droite, ce qui permet aux utilisateurs de poser des questions tout en lisant.

Liste des fonctions
- Extraction et structuration du contenu des PDFLe logiciel : extrait automatiquement le texte des documents PDF, génère un contenu structuré et prend en charge le traitement par lots de plusieurs documents.
- Traduction AI avec le chinois et l'anglaisLes documents sont traduits en chinois ou en anglais afin d'offrir un mode de lecture contrôlé.
- Système de recherche RAGLe site Web de l'Institut de recherche sur la santé publique (IRSP) est un outil de recherche qui permet d'extraire rapidement les informations clés et le contexte des articles en utilisant des techniques de recherche vectorielle.
- IA Questions-réponses intelligentesLes utilisateurs peuvent poser des questions par le biais d'un texte ou d'une voix, et l'IA fournit des réponses précises en rapport avec l'article.
- Interaction vocale et TTSLes fonctions de reconnaissance vocale et de synthèse vocale intégrées permettent de simuler un dialogue professoral.
- Interface interactive à écran partagéLa partie gauche affiche le contenu du document et la partie droite est la zone de questions-réponses sur l'IA, dont l'utilisation est intuitive.
- Traitement des fichiers par lotsPrise en charge de l'insertion de plusieurs PDF dans
data
Dossiers, détectés automatiquement et traités par lots. - la gestion asynchrone des tâchesOptimiser les performances grâce à la gestion des fils d'exécution et prendre en charge le traitement des tâches simultanées.
Utiliser l'aide
Processus d'installation
Mad Professor est un logiciel de développement Python de projets open source, qui doit être installé dans l'environnement local pour fonctionner. Voici les étapes détaillées de l'installation :
- Clonage du code du projet
Exécutez la commande suivante dans un terminal pour cloner un projet depuis GitHub :git clone https://github.com/LYiHub/mad-professor-public.git cd mad-professor-public
- Installation de l'environnement Python
Assurez-vous que Python 3.8 ou une version ultérieure est installé sur votre système. Un environnement virtuel est recommandé :python -m venv venv source venv/bin/activate # Windows 用户运行 venv\Scripts\activate
- Installation des dépendances
Les dépendances du projet incluent le service vocal de MiniMax et d'autres bibliothèques Python. Exécutez la commande suivante pour l'installer :pip install -r requirements.txt
sécurisé
requirements.txt
contient toutes les bibliothèques nécessaires telles quePyPDF2
,numpy
etc. - Configuration des services vocaux MiniMax
Mad Professor utilise le service TTS (Text-to-Speech) de MiniMax et doit configurer un identifiant vocal :- Consultez la documentation officielle de MiniMax à l'adresse .
- Créer ou utiliser un
voice_id
. - modifications
TTS_manager.py
dans le fichierbuild_tts_stream_body
qui définit la méthodevoice_id
Remplacez le paramètre par votre ID, par exemple :body = json.dumps({ "model": "speech-02-turbo", "text": text, "stream": True, "voice_setting": { "voice_id": "your_voice_id_here", "speed": 1, "vol": 1, "pitch": 0, "emotion": mapped_emotion }, "audio_setting": { "sample_rate": 32000, "bitrate": 128000, "format": "pcm", "channel": 1 } })
- Préparation des documents de thèse
Placez le document PDF à traiter dans le répertoire racine du projet, dans le fichierdata
dossier. Le programme détectera automatiquement ces fichiers et les traitera par lots. - programme de course
Démarrer le programme principal :python AI_professor_UI.py
Une fois le programme exécuté, une interface graphique s'ouvre, montrant le contenu du document et la zone d'interaction avec l'IA.
Utilisation
Importation et traitement des documents
- Placez le fichier PDF dans le dossier
data
Dossier. - Après le lancement du programme, l'outil analyse automatiquement
data
d'extraire le contenu du PDF et de générer du texte structuré. - Les résultats de l'extraction sont affichés sur le côté gauche de l'interface, qui prend en charge les modes chinois et anglais. Cliquez sur le bouton "Traduire" de l'interface pour changer de langue.
Questions-réponses et interaction vocale avec l'IA
- Dans la zone de questions et réponses située à droite de l'interface, saisissez du texte ou utilisez le microphone pour poser des questions. Par exemple, "Quelle est la méthodologie de recherche de cet article ?"
- Si vous utilisez l'entrée vocale, assurez-vous que le microphone fonctionne. Si l'indicateur ne devient pas jaune, essayez de remplacer le périphérique d'entrée.
- L'IA analyse le contenu du document et vous donne une réponse précise. Cliquez sur le bouton "Voice Play" et la réponse sera lue à haute voix en format TTS.
- Le volume, la vitesse d'élocution et la hauteur de la voix peuvent être réglés sur l'écran de l'appareil.
TTS_manager.py
Ajustement moyen.
Fonctionnement de l'interface à écran partagé
- Le contenu original ou traduit du document est affiché à gauche et peut être parcouru.
- La partie droite est la fenêtre de dialogue de l'IA, qui permet de poser des questions en temps réel.
- L'interface prend en charge le rendu Markdown et les réponses de l'IA sont affichées dans des bulles de message claires.
fichier de lot
- Pour traiter plusieurs documents, placez tous les fichiers PDF dans le dossier
data
Dossier. - Le programme traite les fichiers non analysés un par un, en générant un contenu structuré et en le stockant localement.
mise en garde
- Assurez-vous que votre connexion internet est stable, le service TTS de MiniMax nécessite une connexion internet.
- sonde
data
Permissions de dossier pour s'assurer que le programme est accessible en lecture et en écriture. - Si l'entrée vocale échoue, vérifiez les réglages du microphone ou remplacez l'appareil.
- Le projet est un logiciel libre et nous recommandons de consulter la dernière documentation sur GitHub pour les mises à jour.
scénario d'application
- recherche universitaire
Les chercheurs peuvent utiliser Mad Professor pour lire et comprendre rapidement des articles complexes. La fonction IA Q&A de l'outil permet de gagner du temps en répondant à des questions spécialisées, telles que la méthodologie de recherche et la conception expérimentale. - Apprentissage des élèves
Les étudiants peuvent lire des documents en langue étrangère en anglais et en chinois, avec des fonctions d'interaction vocale pour aider les débutants à comprendre les termes et les concepts. - Rédaction d'une synthèse de thèse
L'équipe de recherche peut traiter par lots plusieurs articles, extraire des informations clés, générer des documents de synthèse et améliorer l'efficacité de la rédaction. - Collaboration inter-langues
Les équipes de recherche internationales peuvent utiliser la fonction de traduction pour convertir rapidement le contenu de leurs documents dans la langue cible et faciliter la communication.
QA
- Quels sont les formats de fichiers pris en charge par Mad Professor ?
Seuls les fichiers papier au format PDF sont actuellement pris en charge. Veillez à ce que les fichiers PDF soient au format texte extractible et non scannés. - Comment résoudre le problème de l'échec de la saisie vocale ?
Vérifiez que le microphone fonctionne correctement. Si l'indicateur ne devient pas jaune, essayez de remplacer le périphérique d'entrée ou de vérifier les paramètres audio du système. - Dois-je payer pour utiliser le service vocal de MiniMax ?
MiniMax propose des services vocaux gratuits et payants. Nous recommandons de vérifier la documentation officielle pour confirmervoice_id
L'utilisation des autorisations. - Peut-il être utilisé hors ligne ?
Le traitement des PDF et les questions-réponses de l'IA fonctionnent hors ligne, mais l'interaction vocale et la traduction nécessitent un accès à l'internet.
© déclaration de droits d'auteur
L'article est protégé par le droit d'auteur et ne doit pas être reproduit sans autorisation.
Articles connexes
Pas de commentaires...