BiliNote: ИИ-инструмент, который автоматически генерирует заметки в формате Markdown из видео

Общее введение

BiliNote - это инструмент для создания видеозаметок с открытым исходным кодом, поддерживающий извлечение контента из ссылок на видео на BiliBili и YouTube для автоматического создания четко структурированных заметок в формате Markdown. Он использует локальную транскрипцию аудио и различные большие модели (такие как OpenAI, DeepSeek, Qwen) для обобщения контента, поддерживает вставку скриншотов видео и ссылки на переходы по временным меткам. Проект размещен на GitHub под лицензией MIT и доступен в виде развертывания Docker и пакета Windows для студентов, создателей и исследователей, которые могут организовывать материалы для учебы или работы. Официальный онлайн-ресурс размещен на Cloudflare Pages, доступ к которому может быть медленным из-за условий сети.

BiliNote:从视频自动生成Markdown笔记的AI工具

 

Список функций

  • Автоматическое извлечение содержимого из ссылок на видео Beep и YouTube для создания заметок в формате Markdown.
  • Нативная транскрипция аудио с использованием модели Fast-Whisper с поддержкой конфиденциальности.
  • Поддержка OpenAI, DeepSeek, Qwen и других больших моделей для обобщения основного содержания видео.
  • Дополнительная вставка скриншотов с ключевыми кадрами видео для улучшения визуализации заметок.
  • Создавайте заметки с временными метками и поддержкой перехода к соответствующему моменту времени исходного видео.
  • Функция ведения журнала задач позволяет просматривать историю заметок для создания записей.
  • Поддержка развертывания Docker одним щелчком мыши для упрощения локальной или облачной установки.
  • Упакованная версия (exe-файл) доступна для Windows и не требует сложной настройки для использования.
  • Планируется поддержка других видеоплатформ, таких как Jitterbug и Shutterbug.

 

Использование помощи

Установка и развертывание

BiliNote предлагает три способа использования: ручное развертывание, развертывание с помощью Docker и версия с пакетом для Windows. Ниже приведены подробные шаги:

Ручное развертывание

  1. Клонирование кода проекта
    Выполните следующую команду, чтобы получить исходный код:

    git clone https://github.com/JefferyHcool/BiliNote.git
    cd BiliNote
    mv .env.example .env
    
  2. Установите FFmpeg
    Для обработки звука BiliNote использует FFmpeg, который должен быть установлен:

    • Мак: Беги brew install ffmpeg
    • Ubuntu/Debian: Беги sudo apt install ffmpeg
    • Windows (компьютер): Скачайте и установите FFmpeg с официального сайта FFmpeg и убедитесь, что путь к исполняемому файлу FFmpeg добавлен в системную переменную окружения PATH.
  3. Настройка внутреннего интерфейса
    Перейдите в каталог бэкенда, установите зависимости и запустите службу:

    cd backend
    pip install -r requirements.txt
    python main.py
    

    компилятор .env файл для настройки ключа и порта API, например:

    API_BASE_URL=http://localhost:8000
    OUT_DIR=note_results
    IMAGE_BASE_URL=/static/screenshots
    MODEL_PROVIDER=openai
    OPENAI_API_KEY=sk-xxxxxx
    DEEP_SEEK_API_KEY=xxx
    QWEN_API_KEY=xxx
    
  4. Настройка передней панели
    Перейдите в каталог front-end, установите зависимости и запустите службу:

    cd BiliNote_frontend
    pnpm install
    pnpm dev
    

    интервью http://localhost:5173 Просмотрите внешний интерфейс.

  5. Оптимизированная транскрипция аудио (опционально)
    Если вы используете графический процессор NVIDIA, вы можете включить ускоренную версию Fast-Whisper для CUDA, см. Проект Fast-Whisper Конфигурация.

Развертывание Docker

  1. Убедитесь, что Docker и Docker Compose установлены.
    Для установки обратитесь к сайту Docker.
  2. Клонирование и настройка проекта
    git clone https://github.com/JefferyHcool/BiliNote.git
    cd BiliNote
    mv .env.example .env
    
  3. Начальные услуги
    Выполните следующую команду, чтобы собрать и запустить контейнер:

    docker compose up --build
    

    По умолчанию используется порт передней панели. http://localhost:${FRONTEND_PORT} и внутренняя часть http://localhost:${BACKEND_PORT}можно найти в .env настраивается в файле.

Упакованная версия Windows

  1. Скачать exe-файл
    Посетите страницу выпуска на GitHub, чтобы загрузить пакет для Windows (exe-файл).
  2. программа бега
    Дважды щелкните по exe-файлу для запуска, не нужно устанавливать FFmpeg или настраивать переменные окружения вручную. При первом запуске необходимо ввести ключ API.
  3. Настройка ключей API
    Введите API-ключ для OpenAI, DeepSeek или Qwen в интерфейсе программы, сохраните его и используйте.

Этапы использования

  1. Посетите BiliNote
    • Локальное развертывание: откройте браузер и посетите http://localhost:5173.
    • Опыт работы в режиме онлайн: посетите https://www.bilinote.app(возможно, из-за медленной загрузки страниц Cloudflare).
    • Упакованная версия для Windows: дважды щелкните на exe-файле, чтобы запустить программу.
  2. Введите ссылку на видео
    Введите в интерфейс ссылку на общедоступное видео с Bleep или YouTube, например. https://www.bilibili.com/video/xxxНажмите "Отправить", чтобы начать процесс. Нажмите "Отправить", чтобы начать обработку.
  3. Параметры генерации конфигурации
    • Модель искусственного интеллекта: Выберите OpenAI, DeepSeek или Qwen для обобщения контента.
    • Вставка скриншотов: Отметьте, нужно ли автоматически вставлять скриншоты видео.
    • ссылка для перехода: Выберите, нужно ли генерировать ссылку перехода с меткой времени.
    • стиль ведения записей: Выберите академический стиль, разговорный стиль или режим целенаправленного извлечения информации (поддержка некоторых стилей зависит от будущих обновлений).
  4. Создавайте заметки
    После нажатия кнопки "Сгенерировать" BiliNote загружает видеозапись, транскрибирует ее в текст с помощью Fast-Whisper и создает заметки в формате Markdown с использованием выбранной макромодели. Время генерации зависит от длины видео и производительности оборудования.
  5. Просмотр и экспорт заметок
    • Заметки отображаются в формате Markdown с заголовками, абзацами, временными метками и скриншотами (если они включены).
    • Нажмите на временную метку, чтобы перейти к соответствующему моменту времени исходного видео.
    • Поддержка экспорта в файлы Markdown, а в будущем планируется поддержка PDF, Word и Понятие Формат.
    • Исторические заметки можно просмотреть на экране "История задач" с поддержкой просмотра и редактирования.

Функциональное управление

  • Родная транскрипция аудиоМодели Fast-Whisper запускаются локально для защиты конфиденциальности данных. Поддержка ускорения CUDA для более быстрой транскрипции.
  • Поддержка нескольких моделей: Переключение между OpenAI, DeepSeek или Qwen для разных языков и сценариев (например, Qwen лучше подходит для китайского видео).
  • Вставка скриншотов: Автоматически перехватывает ключевые кадры видео и вставляет их в соответствующие позиции заметок для повышения удобочитаемости.
  • История миссии: Каждое созданное задание автоматически сохраняется для последующего просмотра или изменения.
  • Упакованная версия Windows: Обеспечьте возможность использования "из коробки" для нетехнических пользователей и упростите процесс установки.

предостережение

  • Ссылки на видео должны быть общедоступными, частные видео могут не обрабатываться.
  • Функция обобщения контента должна быть настроена с использованием действительного ключа API (OpenAI, DeepSeek или Qwen).
  • FFmpeg должен быть правильно установлен (за исключением пакетов для Windows).
  • Онлайн-версия может загружаться медленно из-за ограничений Cloudflare Pages, поэтому мы рекомендуем развертывать ее локально или использовать версию для Windows.
  • Обеспечьте стабильность сети, чтобы избежать сбоев при загрузке аудио или вызове API.

 

сценарий применения

  1. Студенты организуют свои заметки для онлайн-занятий
    Студенты могут делать заметки в формате Markdown из видеороликов Beep или YouTube, извлекая ключевые моменты и временные метки для удобства пересмотра и ориентации.
  2. Создатели контента собирают материал
    Создатели могут извлекать сценарии видео или ключевую информацию, чтобы создавать заметки со скриншотами для создания контента или копирайтинга.
  3. Архивирование материалов корпоративного обучения
    Предприятия могут превращать учебные видео в структурированные заметки, которые сотрудники могут просматривать или архивировать, что повышает эффективность обучения.
  4. Исследователи собирают академические лекции
    Исследователи могут превращать видеозаписи научных конференций в заметки, извлекать основные идеи и данные и создавать базу знаний.
  5. Управление персональными знаниями
    Пользователи могут превращать интересующие их видео (например, учебники, подкасты) в заметки и сохранять их в своей личной базе знаний для доступа в любое время.

 

QA

  1. Какие видеоплатформы поддерживает BiliNote?
    В настоящее время он поддерживает Beili и YouTube, а в будущем планирует поддерживать Jieyin и Qunjie.
  2. В чем разница между упакованной версией Windows и локальной установкой?
    Упакованная версия для Windows избавляет нетехнических пользователей от необходимости вручную устанавливать FFmpeg или настраивать среду. Локальное развертывание более гибкое, с поддержкой пользовательских конфигураций и GPU-ускорения.
  3. Как увеличить скорость транскрибирования аудио?
    Для версии с ускорением CUDA, использующей устройство NVIDIA GPU с включенным Fast-Whisper, обратитесь к проекту Fast-Whisper.
  4. Нужно ли мне использовать платный ключ API?
    Для работы функции обобщения контента требуется API-ключ для OpenAI, DeepSeek или Qwen (может потребоваться оплата). Транскрипция аудио может быть выполнена локально бесплатно.
  5. Почему онлайн-версия опыта загружается медленно?
    Онлайн-версия развернута на Cloudflare Pages и подвержена ограничениям сети и сервера. Рекомендуется использовать локальное развертывание или пакетные версии для Windows.
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...