Mad Professor: инструмент искусственного интеллекта, помогающий читать и анализировать научные статьи

Общее введение

Mad Professor (暴躁的教授读论文) - это академический инструмент с открытым исходным кодом, разработанный для исследователей и студентов, чтобы упростить чтение и анализ научных работ. Он включает в себя обработку PDF-файлов, перевод с помощью ИИ, поиск по RAG, вопросы и ответы с помощью ИИ и голосовое взаимодействие. Пользователи могут импортировать PDF-документы, и инструмент автоматически извлекает содержимое, переводит и генерирует структурированный текст, который можно читать как на китайском, так и на английском языке. Mad Professor помогает пользователям быстро понять содержание статей с помощью интеллектуальных вопросов и ответов и голосового взаимодействия. Кроме того, в программе предусмотрен интерфейс с разделенным экраном, где слева отображается статья, а справа - диалог с искусственным интеллектом, что удобно для пользователей, которые могут задавать вопросы во время чтения.

Mad Professor:辅助阅读和分析学术论文的AI工具

 

Список функций

  • Извлечение и структурирование содержимого PDF: Автоматическое извлечение текста из PDF-документов, создание структурированного содержимого и поддержка пакетной обработки нескольких документов.
  • ИИ-переводчик с китайского и английского языков: Переведите содержание газеты на китайский или английский язык, чтобы обеспечить контролируемый режим чтения.
  • Поисковая система RAG: Быстрое извлечение ключевой информации и контекста из статей на основе методов векторного поиска.
  • Интеллектуальный ИИ Вопросы и ответы: Поддерживает пользователей, которые могут задавать вопросы с помощью текста или голоса, а искусственный интеллект дает точные ответы, относящиеся к статье.
  • Голосовое взаимодействие и TTS: Встроенная функция распознавания голосового ввода и преобразования текста в речь для имитации профессорского диалога.
  • Интерактивный интерфейс с разделенным экраномВ левой части отображается содержание статьи, а в правой - интуитивно понятная область вопросов и ответов AI.
  • Пакетная обработка файлов: Поддержка размещения нескольких PDF-файлов в data Папки, автоматически обнаруженные и прошедшие пакетную обработку.
  • асинхронное управление задачами: Оптимизация производительности за счет управления потоками и поддержка одновременной обработки задач.

 

Использование помощи

Процесс установки

Mad Professor - это Python-разработчик проектов с открытым исходным кодом, который необходимо установить в локальной среде для запуска. Вот подробные шаги по установке:

  1. Клонирование кода проекта
    Выполните следующую команду в терминале, чтобы клонировать проект с GitHub:

    git clone https://github.com/LYiHub/mad-professor-public.git
    cd mad-professor-public
  1. Установка среды Python
    Убедитесь, что в вашей системе установлен Python 3.8 или более поздней версии. Рекомендуется использовать виртуальную среду:

    python -m venv venv
    source venv/bin/activate  # Windows 用户运行 venv\Scripts\activate
    
  2. Установка зависимостей
    Зависимости проекта включают голосовой сервис MiniMax и другие библиотеки Python. Для установки выполните следующую команду:

    pip install -r requirements.txt
    

    безопасный requirements.txt Файл содержит все необходимые библиотеки, такие как PyPDF2, иnumpy и т.д.

  3. Настройка голосовых служб MiniMax
    Mad Professor использует сервис TTS (Text-to-Speech) от MiniMax и нуждается в настройке голосового идентификатора:

    • Посетите официальную документацию MiniMax по адресу .
    • Создайте или используйте существующий voice_id.
    • модификации TTS_manager.py в файле build_tts_stream_body метод, который устанавливает voice_id Замените параметр на свой ID. например:
      body = json.dumps({
      "model": "speech-02-turbo",
      "text": text,
      "stream": True,
      "voice_setting": {
      "voice_id": "your_voice_id_here",
      "speed": 1,
      "vol": 1,
      "pitch": 0,
      "emotion": mapped_emotion
      },
      "audio_setting": {
      "sample_rate": 32000,
      "bitrate": 128000,
      "format": "pcm",
      "channel": 1
      }
      })
      
  4. Подготовка документов для диссертации
    Поместите обрабатываемый документ в формате PDF в корневой каталог проекта в папке data папка. Программа автоматически обнаружит и пакетно обработает эти файлы.
  5. программа бега
    Запустите основную программу:

    python AI_professor_UI.py
    

    При запуске программы открывается графический интерфейс, показывающий содержимое бумаги и область взаимодействия с ИИ.

Использование

Ввоз и обработка документов

  • Поместите файл PDF в папку data Папка.
  • После запуска программы инструмент автоматически сканирует data папку, извлекать содержимое PDF и генерировать структурированный текст.
  • Результаты извлечения отображаются в левой части интерфейса, который поддерживает китайский и английский языки. Чтобы переключить язык, нажмите кнопку "Перевести" в интерфейсе.

ИИ в вопросах и ответах и голосовое взаимодействие

  • В области вопросов и ответов, расположенной в правой части интерфейса, введите текст или задайте вопросы с помощью микрофона. Например, "Какова методология исследования в этой работе?".
  • Если используется голосовой ввод, убедитесь, что микрофонное устройство работает. Если индикатор не загорается желтым, попробуйте заменить устройство ввода.
  • ИИ анализирует содержание бумаги и дает вам точный ответ. Нажмите на кнопку "Голосовое воспроизведение", и ответ будет зачитан вслух в формате TTS.
  • Громкость, скорость речи и высоту тона голосового вывода можно настроить на устройстве TTS_manager.py Средняя регулировка.

Работа с интерфейсом раздельного экрана

  • Оригинальное или переведенное содержание статьи отображается слева и может быть прокручено.
  • Справа находится диалоговое окно ИИ, поддерживающее вопросы и ответы в режиме реального времени.
  • Интерфейс поддерживает рендеринг в формате Markdown, а ответы ИИ отображаются в виде прозрачных пузырьков сообщений.

пакетный файл

  • Чтобы обработать несколько документов, поместите все PDF-файлы в папку data Папка.
  • Программа обрабатывает неразобранные файлы один за другим, генерируя структурированное содержимое и сохраняя его локально.

предостережение

  • Убедитесь, что ваше интернет-соединение стабильно, услуга TTS от MiniMax требует подключения к интернету.
  • зонд data Разрешения папки, чтобы убедиться, что программа доступна для чтения и записи.
  • Если голосовой ввод не удается, проверьте настройки микрофона или замените устройство.
  • Проект является открытым программным обеспечением, и мы рекомендуем проверять последнюю документацию на GitHub для получения обновлений.

 

сценарий применения

  1. научные исследования
    Исследователи могут использовать Mad Professor для быстрого чтения и понимания сложных статей. Функция искусственного интеллекта "Вопрос-ответ" позволяет сэкономить время, отвечая на специализированные вопросы, такие как методология исследования и экспериментальный дизайн.
  2. Обучение студентов
    Студенты могут читать статьи на иностранном языке как на английском, так и на китайском, с функциями голосового взаимодействия, помогающими понять термины и понятия для начинающих.
  3. Написание синтеза диссертации
    Исследовательская группа может пакетно обрабатывать множество статей, извлекать ключевую информацию, генерировать обзорные материалы и повышать эффективность написания статей.
  4. Межъязыковое сотрудничество
    Международные исследовательские группы могут использовать функцию перевода, чтобы быстро перевести содержание своих документов на целевой язык и облегчить общение.

 

QA

  1. Какие форматы файлов поддерживает Mad Professor?
    В настоящее время поддерживаются только бумажные файлы в формате PDF. Убедитесь, что файлы PDF имеют текстовый формат, а не отсканированы.
  2. Как решить проблему неудачного голосового ввода?
    Убедитесь, что микрофон работает правильно. Если индикатор не загорается желтым, попробуйте заменить устройство ввода или проверить системные настройки звука.
  3. Нужно ли платить за пользование голосовой связью MiniMax?
    MiniMax предлагает бесплатные и платные голосовые услуги. Мы рекомендуем проверить официальную документацию, чтобы подтвердить voice_id Использование разрешений.
  4. Можно ли использовать его в автономном режиме?
    Обработка PDF-файлов и искусственный интеллект Q&A работают в автономном режиме, но для голосового взаимодействия и перевода требуется доступ в интернет.
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...