Mad Professor: una herramienta de inteligencia artificial que ayuda a leer y analizar trabajos académicos
Últimos recursos sobre IAPublicado hace 4 meses Círculo de intercambio de inteligencia artificial 10.7K 00
Introducción general
Mad Professor (暴躁的教授读论文) es una herramienta académica de IA de código abierto diseñada para que investigadores y estudiantes simplifiquen la lectura y el análisis de documentos académicos. Integra procesamiento de PDF, traducción IA, búsqueda RAG, preguntas y respuestas IA e interacción por voz. Los usuarios pueden importar documentos PDF y la herramienta extraerá automáticamente el contenido, lo traducirá y generará un texto estructurado que podrá leerse tanto en chino como en inglés. Mad Professor ayuda a los usuarios a comprender rápidamente el contenido de los documentos mediante preguntas y respuestas inteligentes y la interacción por voz. También ofrece una interfaz de pantalla dividida, que muestra el documento a la izquierda y el diálogo de IA a la derecha, lo que resulta muy práctico para que los usuarios hagan preguntas mientras leen.

Lista de funciones
- Extracción y estructuración de contenidos PDF: Extrae automáticamente texto de documentos PDF, genera contenido estructurado y admite el procesamiento por lotes de varios documentos.
- Traducción automática con chino e inglés: Traduce el contenido del documento al chino o al inglés para ofrecer un modo de lectura controlada.
- Sistema de recuperación RAG: Extracción rápida de información clave y de contexto en artículos basada en técnicas de recuperación vectorial.
- AI Inteligente Preguntas y respuestas: Permite a los usuarios formular preguntas mediante texto o voz, y la IA proporciona respuestas precisas relacionadas con el trabajo.
- Interacción vocal y TTSReconocimiento de voz integrado y función de conversión de texto a voz para simular el diálogo entre profesores.
- Interfaz interactiva de pantalla divididaLa parte izquierda muestra el contenido del documento, y la derecha es el área de preguntas y respuestas de AI, de manejo intuitivo.
- Tratamiento de ficheros por lotesSoporte para poner múltiples PDFs en
data
Carpetas, detectadas automáticamente y procesadas por lotes. - gestión asíncrona de tareasOptimiza el rendimiento mediante la gestión de hilos y admite el procesamiento simultáneo de tareas.
Utilizar la ayuda
Proceso de instalación
Mad Professor es un desarrollo Python de proyectos de código abierto, necesita ser instalado en el entorno local para ejecutarse . Aquí están los pasos detallados de instalación:
- Clonación del código del proyecto
Ejecuta el siguiente comando en un terminal para clonar un proyecto desde GitHub:git clone https://github.com/LYiHub/mad-professor-public.git cd mad-professor-public
- Instalación del entorno Python
Asegúrese de que Python 3.8 o posterior está instalado en su sistema. Se recomienda un entorno virtual:python -m venv venv source venv/bin/activate # Windows 用户运行 venv\Scripts\activate
- Instalación de dependencias
Las dependencias del proyecto incluyen el servicio de voz de MiniMax y otras librerías de Python. Ejecute el siguiente comando para instalarlo:pip install -r requirements.txt
seguro
requirements.txt
contiene todas las bibliotecas necesarias, comoPyPDF2
ynumpy
etc. - Configuración de los servicios de voz MiniMax
Mad Professor utiliza el servicio TTS (texto a voz) de MiniMax y necesita configurar un identificador de voz:- Visite la documentación oficial de MiniMax en .
- Cree o utilice un
voice_id
. - modificaciones
TTS_manager.py
en el archivobuild_tts_stream_body
que establece el métodovoice_id
Sustituya el parámetro por su ID, por ejemplo:body = json.dumps({ "model": "speech-02-turbo", "text": text, "stream": True, "voice_setting": { "voice_id": "your_voice_id_here", "speed": 1, "vol": 1, "pitch": 0, "emotion": mapped_emotion }, "audio_setting": { "sample_rate": 32000, "bitrate": 128000, "format": "pcm", "channel": 1 } })
- Preparación de documentos de tesis
Coloque el documento PDF que se va a procesar en el directorio raíz del proyecto en la carpetadata
carpeta. El programa detectará automáticamente estos archivos y los procesará por lotes. - programa de carrera
Inicie el programa principal:python AI_professor_UI.py
Una vez ejecutado el programa, se abre una interfaz gráfica que muestra el contenido del documento y la zona de interacción con la IA.
Utilización
Importación y tramitación de documentos
- Coloque el archivo PDF en la carpeta
data
Carpeta. - Tras iniciar el programa, la herramienta escanea automáticamente
data
extraer el contenido del PDF y generar texto estructurado. - Los resultados de la extracción se muestran en la parte izquierda de la interfaz, que admite los modos chino e inglés. Haz clic en el botón "Traducir" de la interfaz para cambiar de idioma.
Preguntas y respuestas con IA e interacción por voz
- En el área de preguntas y respuestas de la parte derecha de la interfaz, escriba texto o utilice el micrófono para hacer preguntas. Por ejemplo: "¿Cuál es la metodología de investigación de este artículo?".
- Si utiliza la entrada de voz, asegúrese de que el dispositivo de micrófono funciona. Si el indicador no se vuelve amarillo, pruebe a sustituir el dispositivo de entrada.
- La IA analiza el contenido del papel y te da una respuesta precisa. Haz clic en el botón "Reproducir voz" y la respuesta se leerá en voz alta en formato TTS.
- El volumen, la velocidad de voz y el tono de la salida de voz pueden ajustarse en la opción
TTS_manager.py
Ajuste medio.
Funcionamiento de la interfaz de pantalla dividida
- El contenido original o traducido del documento aparece a la izquierda y puede desplazarse por él.
- La parte derecha es la ventana de diálogo de la IA, que admite preguntas y respuestas en tiempo real.
- La interfaz es compatible con Markdown, y las respuestas de IA se muestran en burbujas de mensaje claras.
archivo por lotes
- Para procesar varios documentos, coloque todos los archivos PDF en la carpeta
data
Carpeta. - El programa procesa uno a uno los archivos no analizados, generando contenidos estructurados y almacenándolos localmente.
advertencia
- Asegúrate de que tu conexión a Internet es estable, el servicio TTS de MiniMax requiere una conexión a Internet.
- sonda
data
Permisos de carpeta para garantizar que el programa se puede leer y escribir. - Si falla la entrada de voz, compruebe los ajustes del micrófono o sustituya la unidad.
- El proyecto es software de código abierto y recomendamos consultar la documentación más reciente en GitHub para estar al día.
escenario de aplicación
- investigación académica
Los investigadores pueden utilizar Mad Professor para leer y comprender rápidamente documentos complejos. La función AI Q&A de la herramienta ahorra tiempo al responder a preguntas especializadas, como la metodología de la investigación y el diseño experimental. - Aprendizaje de los estudiantes
Los estudiantes pueden leer trabajos en lenguas extranjeras tanto en inglés como en chino, con funciones de interacción por voz para ayudar a entender términos y conceptos a los principiantes. - Redactar una síntesis de tesis
El equipo de investigación puede procesar por lotes varios documentos, extraer información clave, generar material de revisión y mejorar la eficacia de la redacción. - Colaboración multilingüe
Los equipos de investigación internacionales pueden utilizar la función de traducción para convertir rápidamente el contenido de sus documentos a la lengua de destino y facilitar la comunicación.
CONTROL DE CALIDAD
- ¿Qué formatos de archivo admite Mad Professor?
Actualmente sólo se admiten archivos de papel en formato PDF. Asegúrese de que los archivos PDF estén en un formato que permita extraer texto, no escaneados. - ¿Cómo resolver el problema de la entrada de voz fallida?
Compruebe que el micrófono funciona correctamente. Si el indicador no se vuelve amarillo, intente sustituir el dispositivo de entrada o compruebe los ajustes de audio del sistema. - ¿Tengo que pagar para utilizar el servicio de voz de MiniMax?
MiniMax ofrece servicios de voz gratuitos y de pago. Recomendamos consultar la documentación oficial para confirmarvoice_id
El uso de permisos. - ¿Se puede utilizar sin conexión?
El procesamiento de PDF y las preguntas y respuestas con inteligencia artificial funcionan sin conexión, pero la interacción por voz y la traducción requieren acceso a Internet.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...