Mad Professor: una herramienta de inteligencia artificial que ayuda a leer y analizar trabajos académicos

Últimos recursos sobre IAPublicado hace 11 meses Círculo de intercambio de inteligencia artificial

81.5K 00

Introducción general

Mad Professor (暴躁的教授读论文) es una herramienta académica de IA de código abierto diseñada para que investigadores y estudiantes simplifiquen la lectura y el análisis de documentos académicos. Integra procesamiento de PDF, traducción IA, búsqueda RAG, preguntas y respuestas IA e interacción por voz. Los usuarios pueden importar documentos PDF y la herramienta extraerá automáticamente el contenido, lo traducirá y generará un texto estructurado que podrá leerse tanto en chino como en inglés. Mad Professor ayuda a los usuarios a comprender rápidamente el contenido de los documentos mediante preguntas y respuestas inteligentes y la interacción por voz. También ofrece una interfaz de pantalla dividida, que muestra el documento a la izquierda y el diálogo de IA a la derecha, lo que resulta muy práctico para que los usuarios hagan preguntas mientras leen.

Lista de funciones

Extracción y estructuración de contenidos PDF: Extrae automáticamente texto de documentos PDF, genera contenido estructurado y admite el procesamiento por lotes de varios documentos.
Traducción automática con chino e inglés: Traduce el contenido del documento al chino o al inglés para ofrecer un modo de lectura controlada.
Sistema de recuperación RAG: Extracción rápida de información clave y de contexto en artículos basada en técnicas de recuperación vectorial.
AI Inteligente Preguntas y respuestas: Permite a los usuarios formular preguntas mediante texto o voz, y la IA proporciona respuestas precisas relacionadas con el trabajo.
Interacción vocal y TTSReconocimiento de voz integrado y función de conversión de texto a voz para simular el diálogo entre profesores.
Interfaz interactiva de pantalla divididaLa parte izquierda muestra el contenido del documento, y la derecha es el área de preguntas y respuestas de AI, de manejo intuitivo.
Tratamiento de ficheros por lotesSoporte para poner múltiples PDFs en data Carpetas, detectadas automáticamente y procesadas por lotes.
gestión asíncrona de tareasOptimiza el rendimiento mediante la gestión de hilos y admite el procesamiento simultáneo de tareas.

Utilizar la ayuda

Proceso de instalación

Mad Professor es un desarrollo Python de proyectos de código abierto, necesita ser instalado en el entorno local para ejecutarse . Aquí están los pasos detallados de instalación:

Clonación del código del proyecto
Ejecuta el siguiente comando en un terminal para clonar un proyecto desde GitHub:
```
git clone https://github.com/LYiHub/mad-professor-public.git
cd mad-professor-public
```

Instalación del entorno Python
Asegúrese de que Python 3.8 o posterior está instalado en su sistema. Se recomienda un entorno virtual:
```
python -m venv venv
source venv/bin/activate  # Windows 用户运行 venv\Scripts\activate
```
Instalación de dependencias
Las dependencias del proyecto incluyen el servicio de voz de MiniMax y otras librerías de Python. Ejecute el siguiente comando para instalarlo:
```
pip install -r requirements.txt
```
seguro requirements.txt contiene todas las bibliotecas necesarias, como PyPDF2ynumpy etc.
Configuración de los servicios de voz MiniMax
Mad Professor utiliza el servicio TTS (texto a voz) de MiniMax y necesita configurar un identificador de voz:
- Visite la documentación oficial de MiniMax en .
- Cree o utilice un voice_id.
- modificaciones TTS_manager.py en el archivo build_tts_stream_body que establece el método voice_id Sustituya el parámetro por su ID, por ejemplo:
```
body = json.dumps({
"model": "speech-02-turbo",
"text": text,
"stream": True,
"voice_setting": {
"voice_id": "your_voice_id_here",
"speed": 1,
"vol": 1,
"pitch": 0,
"emotion": mapped_emotion
},
"audio_setting": {
"sample_rate": 32000,
"bitrate": 128000,
"format": "pcm",
"channel": 1
}
})
```
Preparación de documentos de tesis
Coloque el documento PDF que se va a procesar en el directorio raíz del proyecto en la carpeta data carpeta. El programa detectará automáticamente estos archivos y los procesará por lotes.
programa de carrera
Inicie el programa principal:
```
python AI_professor_UI.py
```
Una vez ejecutado el programa, se abre una interfaz gráfica que muestra el contenido del documento y la zona de interacción con la IA.

Utilización

Importación y tramitación de documentos

Coloque el archivo PDF en la carpeta data Carpeta.
Tras iniciar el programa, la herramienta escanea automáticamente data extraer el contenido del PDF y generar texto estructurado.
Los resultados de la extracción se muestran en la parte izquierda de la interfaz, que admite los modos chino e inglés. Haz clic en el botón "Traducir" de la interfaz para cambiar de idioma.

Preguntas y respuestas con IA e interacción por voz

En el área de preguntas y respuestas de la parte derecha de la interfaz, escriba texto o utilice el micrófono para hacer preguntas. Por ejemplo: "¿Cuál es la metodología de investigación de este artículo?".
Si utiliza la entrada de voz, asegúrese de que el dispositivo de micrófono funciona. Si el indicador no se vuelve amarillo, pruebe a sustituir el dispositivo de entrada.
La IA analiza el contenido del papel y te da una respuesta precisa. Haz clic en el botón "Reproducir voz" y la respuesta se leerá en voz alta en formato TTS.
El volumen, la velocidad de voz y el tono de la salida de voz pueden ajustarse en la opción TTS_manager.py Ajuste medio.

Funcionamiento de la interfaz de pantalla dividida

El contenido original o traducido del documento aparece a la izquierda y puede desplazarse por él.
La parte derecha es la ventana de diálogo de la IA, que admite preguntas y respuestas en tiempo real.
La interfaz es compatible con Markdown, y las respuestas de IA se muestran en burbujas de mensaje claras.

archivo por lotes

Para procesar varios documentos, coloque todos los archivos PDF en la carpeta data Carpeta.
El programa procesa uno a uno los archivos no analizados, generando contenidos estructurados y almacenándolos localmente.

advertencia

Asegúrate de que tu conexión a Internet es estable, el servicio TTS de MiniMax requiere una conexión a Internet.
sonda data Permisos de carpeta para garantizar que el programa se puede leer y escribir.
Si falla la entrada de voz, compruebe los ajustes del micrófono o sustituya la unidad.
El proyecto es software de código abierto y recomendamos consultar la documentación más reciente en GitHub para estar al día.

escenario de aplicación

investigación académica
Los investigadores pueden utilizar Mad Professor para leer y comprender rápidamente documentos complejos. La función AI Q&A de la herramienta ahorra tiempo al responder a preguntas especializadas, como la metodología de la investigación y el diseño experimental.
Aprendizaje de los estudiantes
Los estudiantes pueden leer trabajos en lenguas extranjeras tanto en inglés como en chino, con funciones de interacción por voz para ayudar a entender términos y conceptos a los principiantes.
Redactar una síntesis de tesis
El equipo de investigación puede procesar por lotes varios documentos, extraer información clave, generar material de revisión y mejorar la eficacia de la redacción.
Colaboración multilingüe
Los equipos de investigación internacionales pueden utilizar la función de traducción para convertir rápidamente el contenido de sus documentos a la lengua de destino y facilitar la comunicación.

CONTROL DE CALIDAD

¿Qué formatos de archivo admite Mad Professor?
Actualmente sólo se admiten archivos de papel en formato PDF. Asegúrese de que los archivos PDF estén en un formato que permita extraer texto, no escaneados.
¿Cómo resolver el problema de la entrada de voz fallida?
Compruebe que el micrófono funciona correctamente. Si el indicador no se vuelve amarillo, intente sustituir el dispositivo de entrada o compruebe los ajustes de audio del sistema.
¿Tengo que pagar para utilizar el servicio de voz de MiniMax?
MiniMax ofrece servicios de voz gratuitos y de pago. Recomendamos consultar la documentación oficial para confirmar voice_id El uso de permisos.
¿Se puede utilizar sin conexión?
El procesamiento de PDF y las preguntas y respuestas con inteligencia artificial funcionan sin conexión, pero la interacción por voz y la traducción requieren acceso a Internet.