Local-NotebookLM: локальный PDF для создания голосовых подкастов инструментов с открытым исходным кодом
Общее введение
Local-NotebookLM - это проект с открытым исходным кодом, целью которого является предоставление локально управляемых интеллектуальных инструментов для обработки документов и создания контента. Он находится под контролем Google NotebookLM Проект вдохновлен работой Гёкдениза Гюльмеза и нацелен на то, чтобы помочь пользователям конвертировать документы, например PDF, в различные выходные форматы, такие как подкасты, интервью или лекции, поддерживая при этом локальное развертывание для обеспечения конфиденциальности данных. Разработчик, Гёкдениз Гюльмез, поддерживает проект на GitHub, предоставляя четкие шаги по установке и инструкции. Благодаря поддержке сложных документов, таких как научные статьи, объемом до 100 000 слов и интеллектуальной разбивке на части, проект идеально подходит для пользователей, которым необходимо эффективно анализировать документы или создавать творческий контент. Будь вы студент, исследователь или создатель контента, вы легко сможете преобразовать документы в аудио или выразить себя в различных режимах.
Список функций
- Интеллектуальная обработка документов: Автоматическое извлечение текста PDF, очистка ошибок форматирования, поддержка научных работ, содержащих математические формулы.
- Интеллектуальное разбиение на части: Разделяет большие файлы на управляемые сегменты, поддерживая документы объемом до 100 000 слов.
- Создание мультимодального контентаДоступно 15 форматов выходных данных, включая подкасты, интервью, дебаты, лекции и многое другое.
- Поддержка локального времени выполнения: Нет необходимости полагаться на облачные сервисы, вся обработка выполняется на устройстве пользователя, что гарантирует безопасность данных.
- С открытым исходным кодом и бесплатно: Код находится в открытом доступе на GitHub, и пользователи могут свободно скачивать, изменять и вносить свой вклад.
Использование помощи
Процесс установки
Чтобы использовать Local-NotebookLM локально, вам нужно выполнить следующие шаги для настройки среды и запуска проекта. Ниже приведено подробное руководство по установке, чтобы вы могли быстро приступить к работе.
1. Клонирование складов
Во-первых, убедитесь, что на вашем устройстве установлен Git. Откройте терминал (Command Prompt или PowerShell для пользователей Windows) и введите следующую команду, чтобы клонировать проект локально:
git clone https://github.com/Goekdeniz-Guelmez/Local-NotebookLM.git
После завершения перейдите в каталог проектов:
cd Local-NotebookLM
2. Создание виртуальных сред
Чтобы избежать конфликтов зависимостей, рекомендуется использовать виртуальную среду Python. Выполните следующую команду, чтобы создать и активировать ее:
- Linux/macOS::
python -m venv venv
source venv/bin/activate
- Windows (компьютер)::
python -m venv venv
venv\Scripts\activate
После активации перед подсказкой терминала будет написано (venv)
, указывая на то, что виртуальная среда была введена.
3. Установка зависимостей
Зависимости проекта перечислены в requirements.txt
файл. Выполните следующую команду для установки всех необходимых библиотек:
pip install -r requirements.txt
Процесс установки может занять несколько минут, в зависимости от скорости сети. После завершения pip list
Проверьте, успешно ли прошла установка.
4. Запуск проекта
После завершения установки запустите непосредственно главный файл программы (при условии, что main.py
(Точное название файла основано на последней версии GitHub):
python main.py
Если все пройдет успешно, программа запустится, и вы сможете начать использовать Local-NotebookLM.
Как использовать основные функции
Суть Local-NotebookLM заключается в обработке документов и создании контента, и ниже перечислены конкретные шаги.
Функция 1: Интеллектуальная обработка документов
- Загрузка файлов PDF::
- Подготовьте PDF-файл (например, научную статью или доклад) и поместите его в указанную папку в каталоге проекта (или непосредственно в корневой каталог, если это не указано явно).
- Введите путь к файлу в интерфейсе программы (или в командной строке, в зависимости от версии), например:
input.pdf
.
- Извлечение и очистка текста::
- Программа автоматически извлекает текст из PDF и удаляет лишние переносы строк, пробелы или ошибки форматирования.
- Для документов, содержащих математические формулы, инструмент постарается сохранить структуру формул, чтобы обеспечить целостность содержимого.
- Просмотр результатов::
- Обработанный текст сохраняется в виде обычного текстового файла (например.
output.txt
), или отображается непосредственно в интерфейсе для выполнения следующего шага.
- Обработанный текст сохраняется в виде обычного текстового файла (например.
Функция 2: Интеллектуальная сортировка
- Применимые сценарии: Если объем загружаемого PDF превышает несколько тысяч слов, программа автоматически разбивает его на фрагменты.
- процедура::
- Укажите параметры разбивки на части (например, 5000 слов на часть) при запуске программы. пример команды:
python main.py --chunk-size 5000 input.pdf
- Разбитое на части содержимое сохраняется в порядке нескольких файлов (например.
chunk1.txt
, иchunk2.txt
) для облегчения последующих действий.
- Укажите параметры разбивки на части (например, 5000 слов на часть) при запуске программы. пример команды:
- предостережение: Максимальная поддержка 100 000 слов, если файл слишком велик, рекомендуется разделить его заранее.
Функция 3: создание многорежимного контента
- Выберите формат вывода::
- Программа поддерживает 15 режимов, таких как подкасты, интервью и т.д. Время выполнения задается параметрами, например
python main.py --mode podcast input.txt
- Программа поддерживает 15 режимов, таких как подкасты, интервью и т.д. Время выполнения задается параметрами, например
- Создавайте контент::
- На основе извлеченного текста программа генерирует контент в соответствующем формате, например, в режиме подкаста будет имитироваться диалог двух человек.
- Сгенерированные результаты обычно сохраняются в виде аудиофайлов (например.
output.mp3
) или текстовые скрипты (напримерscript.txt
).
- Воспроизведение или редактирование::
- Используйте любой аудиоплеер (например, VLC), чтобы открыть созданный
.mp3
файл, или подкорректируйте скрипт в текстовом редакторе и сгенерируйте его заново.
- Используйте любой аудиоплеер (например, VLC), чтобы открыть созданный
Советы по эксплуатации и меры предосторожности
- Экологические требования: Убедитесь, что версия Python 3.8 или выше, ffmpeg рекомендуется (для обработки звука) и доступен для пользователей Linux.
sudo apt install ffmpeg
Если вы являетесь пользователем Windows, вам необходимо загрузить и настроить переменные окружения. - путь к файлу: Во избежание ошибок кодировки не используйте китайские пути при вводе путей к файлам.
- Проблемы отладки: Если вы получаете ошибку, проверьте, полностью ли установлены зависимости, или обратитесь за помощью к сообществу на странице GitHub Issues.
- Расширенная функциональностьПользователи, знакомые с программированием, могут модифицировать код для добавления пользовательских форматов вывода, а открытый исходный код проекта предоставляет неограниченные возможности для этого.
Выполнив эти действия, вы сможете легко преобразовывать PDF-документы в подкасты или другие формы контента и наслаждаться локализованной интеллектуальной обработкой. Будь то академические исследования или генерация идей, Local-NotebookLM станет вашей правой рукой.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...