일반 소개
Mad Professor(暴躁的教授读论文)는 연구자와 학생들이 학술 논문을 쉽게 읽고 분석할 수 있도록 설계된 오픈 소스 AI 학술 도구입니다. PDF 처리, AI 번역, RAG 검색, AI Q&A 및 음성 상호작용이 통합되어 있습니다. 사용자는 PDF 논문을 가져올 수 있으며, 이 도구는 자동으로 내용을 추출하고 번역하여 중국어와 영어로 읽을 수 있는 구조화된 텍스트를 생성하며, Mad 교수는 지능형 Q&A와 음성 상호작용을 통해 사용자가 논문의 내용을 빠르게 이해할 수 있도록 도와줍니다. 또한 왼쪽에는 논문이 표시되고 오른쪽에는 AI 대화가 표시되는 분할 화면 인터페이스를 제공하여 사용자가 읽으면서 질문할 수 있어 편리합니다.

기능 목록
- PDF 콘텐츠 추출 및 구조화PDF 문서에서 텍스트를 자동으로 추출하고, 구조화된 콘텐츠를 생성하며, 여러 문서의 일괄 처리를 지원합니다.
- 중국어 및 영어 AI 번역문서 내용을 중국어 또는 영어로 번역하여 제어 읽기 모드를 제공합니다.
- 헝겊 검색 시스템벡터 검색 기술을 기반으로 논문에서 핵심 정보와 문맥을 빠르게 추출합니다.
- AI 지능형 Q&A사용자가 텍스트나 음성으로 질문하면 AI가 해당 논문과 관련된 정확한 답변을 제공합니다.
- 음성 상호작용 및 TTS음성 입력 인식 및 텍스트 음성 변환 기능이 내장되어 교수님의 대화를 시뮬레이션할 수 있습니다.
- 분할 화면 대화형 인터페이스왼쪽에는 논문 내용이 표시되고, 오른쪽에는 직관적으로 조작할 수 있는 AI Q&A 영역이 있습니다.
- 배치 파일 처리여러 PDF를
data
폴더가 자동으로 감지되어 일괄 처리됩니다. - 비동기 작업 관리스레드 관리를 통해 성능을 최적화하고 동시 작업 처리를 지원합니다.
도움말 사용
설치 프로세스
Mad Professor는 파이썬으로 개발된 오픈 소스 프로젝트이며, 실행하려면 로컬 환경에 설치해야 합니다. 자세한 설치 단계는 다음과 같습니다:
- 프로젝트 코드 복제
터미널에서 다음 명령을 실행하여 GitHub에서 프로젝트를 복제합니다:git clone https://github.com/LYiHub/mad-professor-public.git cd mad-professor-public
- Python 환경 설치
시스템에 Python 3.8 이상이 설치되어 있는지 확인합니다. 가상 환경을 사용하는 것이 좋습니다:python -m venv venv source venv/bin/activate # Windows 用户运行 venv\Scripts\activate
- 종속성 설치
프로젝트 종속성에는 MiniMax의 음성 서비스 및 기타 Python 라이브러리가 포함됩니다. 다음 명령을 실행하여 설치하세요:pip install -r requirements.txt
보안
requirements.txt
파일에는 다음과 같은 모든 필수 라이브러리가 포함되어 있습니다.PyPDF2
및numpy
등 - MiniMax 음성 서비스 구성
Mad Professor는 MiniMax의 TTS(텍스트 음성 변환) 서비스를 사용하며 음성 ID를 구성해야 합니다:- 미니맥스 공식 문서는 에서 확인하세요.
- 만들거나 기존
voice_id
. - 수정
TTS_manager.py
파일에build_tts_stream_body
메서드를 설정하는voice_id
예를 들어 매개변수를 ID로 바꿉니다:body = json.dumps({ "model": "speech-02-turbo", "text": text, "stream": True, "voice_setting": { "voice_id": "your_voice_id_here", "speed": 1, "vol": 1, "pitch": 0, "emotion": mapped_emotion }, "audio_setting": { "sample_rate": 32000, "bitrate": 128000, "format": "pcm", "channel": 1 } })
- 논문 문서 준비
처리할 PDF 용지를 프로젝트 루트 디렉터리의data
폴더에 저장합니다. 프로그램은 이러한 파일을 자동으로 감지하여 일괄 처리합니다. - 실행 중인 프로그램
메인 프로그램을 시작합니다:python AI_professor_UI.py
프로그램을 실행하면 논문 내용과 AI 상호 작용 영역을 보여주는 그래픽 인터페이스가 열립니다.
사용법
문서 가져오기 및 처리
- PDF 파일을
data
폴더. - 프로그램을 실행하면 도구가 자동으로 다음을 검색합니다.
data
폴더에서 PDF 콘텐츠를 추출하고 구조화된 텍스트를 생성합니다. - 추출 결과는 인터페이스 왼쪽에 표시되며 중국어와 영어 모드를 모두 지원합니다. 인터페이스에서 '번역' 버튼을 클릭하면 언어를 전환할 수 있습니다.
AI Q&A 및 음성 상호작용
- 인터페이스 오른쪽의 Q&A 영역에 텍스트를 입력하거나 마이크를 사용하여 질문할 수 있습니다. 예를 들어, "이 논문의 연구 방법론은 무엇인가요?"라고 질문할 수 있습니다.
- 음성 입력을 사용하는 경우 마이크 장치가 작동하는지 확인하세요. 표시등이 노란색으로 바뀌지 않으면 입력 장치를 교체해 보세요.
- AI가 지문의 내용을 분석하여 정확한 답변을 제공합니다. '음성 재생' 버튼을 클릭하면 답변이 TTS 형식으로 소리내어 읽혀집니다.
- 음성 출력의 볼륨, 말하기 속도 및 음높이를 설정할 수 있습니다.
TTS_manager.py
중간 조정.
분할 화면 인터페이스 작동
- 문서의 원본 또는 번역된 콘텐츠가 왼쪽에 표시되며 스크롤하여 살펴볼 수 있습니다.
- 오른쪽은 실시간 Q&A를 지원하는 AI 대화창입니다.
- 인터페이스는 마크다운 렌더링을 지원하며, AI 응답은 명확한 메시지 풍선으로 표시됩니다.
배치 파일
- 여러 장의 문서를 처리하려면 모든 PDF 파일을
data
폴더. - 이 프로그램은 구문 분석되지 않은 파일을 하나씩 처리하여 구조화된 콘텐츠를 생성하고 로컬에 저장합니다.
주의
- 인터넷 연결이 안정적인지 확인하세요. 미니막스의 TTS 서비스를 사용하려면 인터넷 연결이 필요합니다.
- 프로브
data
폴더 권한을 설정하여 프로그램을 읽고 쓸 수 있도록 합니다. - 음성 입력에 실패하면 마이크 설정을 확인하거나 장치를 교체하세요.
- 이 프로젝트는 오픈 소스 소프트웨어이므로 GitHub에서 최신 문서를 확인하여 업데이트를 확인하는 것이 좋습니다.
애플리케이션 시나리오
- 학술 연구
연구자들은 Mad Professor를 사용해 복잡한 논문을 빠르게 읽고 이해할 수 있습니다. 이 도구의 AI Q&A 기능은 연구 방법론이나 실험 설계와 같은 전문적인 질문에 대한 답변을 제공하여 시간을 절약해 줍니다. - 학생 학습
학생들은 영어와 중국어 모드로 외국어 논문을 읽을 수 있으며, 초급자를 위한 용어와 개념 이해를 돕는 음성 상호작용 기능이 있습니다. - 논문 종합 작성
연구팀은 여러 논문을 일괄 처리하고, 핵심 정보를 추출하고, 검토 자료를 생성하고, 작성 효율성을 개선할 수 있습니다. - 언어 간 협업
국제 연구팀은 번역 기능을 사용하여 논문의 내용을 대상 언어로 빠르게 변환하고 의사소통을 원활하게 할 수 있습니다.
QA
- Mad Professor는 어떤 파일 형식을 지원하나요?
현재 PDF 형식의 종이 파일만 지원됩니다. PDF 파일은 스캔이 아닌 텍스트 추출이 가능한 형식이어야 합니다. - 음성 입력 실패 문제를 해결하려면 어떻게 해야 하나요?
마이크가 제대로 작동하는지 확인하세요. 표시등이 노란색으로 바뀌지 않으면 입력 장치를 교체하거나 시스템 오디오 설정을 확인해 보세요. - 미니맥스의 음성 서비스를 이용하려면 비용을 지불해야 하나요?
미니맥스는 무료 및 유료 음성 서비스를 제공합니다. 공식 문서를 확인하여 다음을 확인하는 것이 좋습니다.voice_id
권한 사용. - 오프라인에서도 사용할 수 있나요?
PDF 처리와 AI Q&A는 오프라인에서 작동하지만 음성 상호작용과 번역은 인터넷 접속이 필요합니다.
© 저작권 정책
이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.
관련 문서
댓글 없음...