Mad Professor : un outil d'IA pour aider à la lecture et à l'analyse d'articles académiques

Dernières ressources sur l'IAPosté il y a 5 mois Cercle de partage de l'IA

18.9K 00

Introduction générale

Mad Professor (暴躁的教授读论文) est un outil académique IA open source conçu pour les chercheurs et les étudiants afin de simplifier la lecture et l'analyse d'articles académiques. Il intègre le traitement des PDF, la traduction par l'IA, la recherche RAG, les questions-réponses par l'IA et l'interaction vocale. Les utilisateurs peuvent importer des documents PDF et l'outil extraira automatiquement le contenu, traduira et générera un texte structuré qui pourra être lu en chinois et en anglais. Mad Professor aide les utilisateurs à comprendre rapidement le contenu des articles grâce à des questions-réponses intelligentes et à l'interaction vocale. Il propose également une interface à écran partagé, affichant l'article à gauche et le dialogue AI à droite, ce qui permet aux utilisateurs de poser des questions tout en lisant.

Liste des fonctions

Extraction et structuration du contenu des PDFLe logiciel : extrait automatiquement le texte des documents PDF, génère un contenu structuré et prend en charge le traitement par lots de plusieurs documents.
Traduction AI avec le chinois et l'anglaisLes documents sont traduits en chinois ou en anglais afin d'offrir un mode de lecture contrôlé.
Système de recherche RAGLe site Web de l'Institut de recherche sur la santé publique (IRSP) est un outil de recherche qui permet d'extraire rapidement les informations clés et le contexte des articles en utilisant des techniques de recherche vectorielle.
IA Questions-réponses intelligentesLes utilisateurs peuvent poser des questions par le biais d'un texte ou d'une voix, et l'IA fournit des réponses précises en rapport avec l'article.
Interaction vocale et TTSLes fonctions de reconnaissance vocale et de synthèse vocale intégrées permettent de simuler un dialogue professoral.
Interface interactive à écran partagéLa partie gauche affiche le contenu du document et la partie droite est la zone de questions-réponses sur l'IA, dont l'utilisation est intuitive.
Traitement des fichiers par lotsPrise en charge de l'insertion de plusieurs PDF dans data Dossiers, détectés automatiquement et traités par lots.
la gestion asynchrone des tâchesOptimiser les performances grâce à la gestion des fils d'exécution et prendre en charge le traitement des tâches simultanées.

Utiliser l'aide

Processus d'installation

Mad Professor est un logiciel de développement Python de projets open source, qui doit être installé dans l'environnement local pour fonctionner. Voici les étapes détaillées de l'installation :

Clonage du code du projet
Exécutez la commande suivante dans un terminal pour cloner un projet depuis GitHub :
```
git clone https://github.com/LYiHub/mad-professor-public.git
cd mad-professor-public
```

Installation de l'environnement Python
Assurez-vous que Python 3.8 ou une version ultérieure est installé sur votre système. Un environnement virtuel est recommandé :
```
python -m venv venv
source venv/bin/activate  # Windows 用户运行 venv\Scripts\activate
```
Installation des dépendances
Les dépendances du projet incluent le service vocal de MiniMax et d'autres bibliothèques Python. Exécutez la commande suivante pour l'installer :
```
pip install -r requirements.txt
```
sécurisé requirements.txt contient toutes les bibliothèques nécessaires telles que PyPDF2,numpy etc.
Configuration des services vocaux MiniMax
Mad Professor utilise le service TTS (Text-to-Speech) de MiniMax et doit configurer un identifiant vocal :
- Consultez la documentation officielle de MiniMax à l'adresse .
- Créer ou utiliser un voice_id.
- modifications TTS_manager.py dans le fichier build_tts_stream_body qui définit la méthode voice_id Remplacez le paramètre par votre ID, par exemple :
```
body = json.dumps({
"model": "speech-02-turbo",
"text": text,
"stream": True,
"voice_setting": {
"voice_id": "your_voice_id_here",
"speed": 1,
"vol": 1,
"pitch": 0,
"emotion": mapped_emotion
},
"audio_setting": {
"sample_rate": 32000,
"bitrate": 128000,
"format": "pcm",
"channel": 1
}
})
```
Préparation des documents de thèse
Placez le document PDF à traiter dans le répertoire racine du projet, dans le fichier data dossier. Le programme détectera automatiquement ces fichiers et les traitera par lots.
programme de course
Démarrer le programme principal :
```
python AI_professor_UI.py
```
Une fois le programme exécuté, une interface graphique s'ouvre, montrant le contenu du document et la zone d'interaction avec l'IA.

Utilisation

Importation et traitement des documents

Placez le fichier PDF dans le dossier data Dossier.
Après le lancement du programme, l'outil analyse automatiquement data d'extraire le contenu du PDF et de générer du texte structuré.
Les résultats de l'extraction sont affichés sur le côté gauche de l'interface, qui prend en charge les modes chinois et anglais. Cliquez sur le bouton "Traduire" de l'interface pour changer de langue.

Questions-réponses et interaction vocale avec l'IA

Dans la zone de questions et réponses située à droite de l'interface, saisissez du texte ou utilisez le microphone pour poser des questions. Par exemple, "Quelle est la méthodologie de recherche de cet article ?"
Si vous utilisez l'entrée vocale, assurez-vous que le microphone fonctionne. Si l'indicateur ne devient pas jaune, essayez de remplacer le périphérique d'entrée.
L'IA analyse le contenu du document et vous donne une réponse précise. Cliquez sur le bouton "Voice Play" et la réponse sera lue à haute voix en format TTS.
Le volume, la vitesse d'élocution et la hauteur de la voix peuvent être réglés sur l'écran de l'appareil. TTS_manager.py Ajustement moyen.

Fonctionnement de l'interface à écran partagé

Le contenu original ou traduit du document est affiché à gauche et peut être parcouru.
La partie droite est la fenêtre de dialogue de l'IA, qui permet de poser des questions en temps réel.
L'interface prend en charge le rendu Markdown et les réponses de l'IA sont affichées dans des bulles de message claires.

fichier de lot

Pour traiter plusieurs documents, placez tous les fichiers PDF dans le dossier data Dossier.
Le programme traite les fichiers non analysés un par un, en générant un contenu structuré et en le stockant localement.

mise en garde

Assurez-vous que votre connexion internet est stable, le service TTS de MiniMax nécessite une connexion internet.
sonde data Permissions de dossier pour s'assurer que le programme est accessible en lecture et en écriture.
Si l'entrée vocale échoue, vérifiez les réglages du microphone ou remplacez l'appareil.
Le projet est un logiciel libre et nous recommandons de consulter la dernière documentation sur GitHub pour les mises à jour.

scénario d'application

recherche universitaire
Les chercheurs peuvent utiliser Mad Professor pour lire et comprendre rapidement des articles complexes. La fonction IA Q&A de l'outil permet de gagner du temps en répondant à des questions spécialisées, telles que la méthodologie de recherche et la conception expérimentale.
Apprentissage des élèves
Les étudiants peuvent lire des documents en langue étrangère en anglais et en chinois, avec des fonctions d'interaction vocale pour aider les débutants à comprendre les termes et les concepts.
Rédaction d'une synthèse de thèse
L'équipe de recherche peut traiter par lots plusieurs articles, extraire des informations clés, générer des documents de synthèse et améliorer l'efficacité de la rédaction.
Collaboration inter-langues
Les équipes de recherche internationales peuvent utiliser la fonction de traduction pour convertir rapidement le contenu de leurs documents dans la langue cible et faciliter la communication.

QA

Quels sont les formats de fichiers pris en charge par Mad Professor ?
Seuls les fichiers papier au format PDF sont actuellement pris en charge. Veillez à ce que les fichiers PDF soient au format texte extractible et non scannés.
Comment résoudre le problème de l'échec de la saisie vocale ?
Vérifiez que le microphone fonctionne correctement. Si l'indicateur ne devient pas jaune, essayez de remplacer le périphérique d'entrée ou de vérifier les paramètres audio du système.
Dois-je payer pour utiliser le service vocal de MiniMax ?
MiniMax propose des services vocaux gratuits et payants. Nous recommandons de vérifier la documentation officielle pour confirmer voice_id L'utilisation des autorisations.
Peut-il être utilisé hors ligne ?
Le traitement des PDF et les questions-réponses de l'IA fonctionnent hors ligne, mais l'interaction vocale et la traduction nécessitent un accès à l'internet.

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling : un outil de synthèse vocale multilingue plus petit et plus rapide que Whisper-Large v3

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Speech to Text

Il y a 8 mois

018.3K

Nœud GaiaNet : installez et exécutez votre propre modèle local de service proxy en ligne

Dernières ressources sur l'IA # AI Java Open Source Projecct # Outil de grand modèle à source ouverte déployé localement

il y a 1 an

019.2K

WhoDB : Logiciel léger de gestion de la visualisation des bases de données avec prise en charge de l'interaction en langage naturel

Dernières ressources sur l'IA # AI Java Open Source Projecct # Analyse des données de l'IA

Il y a 11 mois

020.9K

ClipZap AI Face Swap Tool : échange rapide de visages par l'IA pour les photos et les vidéos (gratuit)

Dernières ressources sur l'IA # AI video face swap

Il y a 8 mois

020.4K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Mad Professor : un outil d'IA pour aider à la lecture et à l'analyse d'articles académiques

Introduction générale

Liste des fonctions