로컬-NotebookLM: 오픈 소스 도구의 음성 팟캐스트를 생성하는 로컬 PDF

79.4K 00

일반 소개

로컬에서 실행되는 지능형 문서 처리 및 콘텐츠 생성 도구를 제공하는 것을 목표로 하는 오픈 소스 프로젝트인 Local-NotebookLM입니다. 이 프로젝트는 Google 노트북LM 이 프로젝트는 괴크데니즈 귈메즈의 작업에서 영감을 얻은 것으로, 사용자가 PDF와 같은 문서를 팟캐스트, 인터뷰, 강의 등 다양한 출력 형식으로 변환할 수 있도록 지원하는 동시에 데이터 개인정보 보호를 위해 로컬 배포를 지원하는 데 중점을 두고 있습니다. 개발자인 괴크데니즈 귈메즈는 GitHub에서 프로젝트를 유지 관리하며 명확한 설치 단계와 지침을 제공합니다. 학술 논문과 같은 복잡한 문서, 최대 10만 단어, 지능형 청킹을 지원하는 이 프로젝트는 문서를 효율적으로 분석하거나 창의적인 콘텐츠를 생성해야 하는 사용자에게 이상적입니다. 학생, 연구원, 콘텐츠 제작자 등 누구나 쉽게 문서를 오디오로 변환하거나 다양한 모드로 표현할 수 있습니다. Local-NotebookLM：本地PDF生成语音播客的开源工具

기능 목록

지능형 문서 처리PDF 텍스트 자동 추출, 서식 오류 정리, 수학 공식이 포함된 학술 논문 지원.
지능형 청크대용량 파일을 관리하기 쉬운 세그먼트로 분할하여 최대 100,000단어까지 문서를 지원합니다.
멀티모달 콘텐츠 생성팟캐스트, 인터뷰, 토론, 강의 등 15가지 출력 형식을 사용할 수 있습니다.
로컬 런타임 지원클라우드 서비스에 의존할 필요 없이 모든 처리가 사용자 기기에서 이루어지므로 데이터 보안이 보장됩니다.
오픈 소스 및 무료코드가 공개되어 있으며 사용자는 자유롭게 다운로드, 수정 및 기여할 수 있습니다.

도움말 사용

설치 프로세스

로컬에서 Local-NotebookLM을 사용하려면 아래 단계에 따라 환경을 구성하고 프로젝트를 실행해야 합니다. 아래는 빠르게 시작하고 실행할 수 있도록 자세한 설치 가이드입니다.

1. 창고 복제

먼저 장치에 Git이 설치되어 있는지 확인합니다. 터미널(Windows 사용자의 경우 명령 프롬프트 또는 PowerShell)을 열고 다음 명령을 입력하여 프로젝트를 로컬로 복제합니다:

git clone https://github.com/Goekdeniz-Guelmez/Local-NotebookLM.git

완료되면 프로젝트 카탈로그로 이동합니다:

cd Local-NotebookLM

2. 가상 환경 생성

종속성 충돌을 피하려면 Python 가상 환경을 사용하는 것이 좋습니다. 다음 명령을 실행하여 생성하고 활성화합니다:

Linux/macOS::

python -m venv venv
source venv/bin/activate

Windows(컴퓨터)::

python -m venv venv
venv\Scripts\activate

활성화 후 터미널 프롬프트 앞에 다음이 표시됩니다. (venv)를 클릭하여 가상 환경이 입력되었음을 나타냅니다.

3. 종속성 설치

프로젝트 종속성은 다음 항목에 나열됩니다. requirements.txt 파일로 이동합니다. 다음 명령을 실행하여 필요한 모든 라이브러리를 설치합니다:

pip install -r requirements.txt

설치 과정은 네트워크 속도에 따라 몇 분 정도 걸릴 수 있습니다. 설치가 완료되면 pip list 설치가 성공적으로 완료되었는지 확인합니다.

4. 프로젝트 실행

설치가 완료되면 메인 프로그램 파일을 직접 실행합니다( main.py(정확한 파일명은 최신 버전의 GitHub를 기준으로 합니다):

python main.py

모든 것이 순조롭게 진행되면 프로그램이 시작되고 Local-NotebookLM을 사용할 수 있습니다.

주요 기능 사용 방법

Local-NotebookLM의 핵심은 문서 처리와 콘텐츠 생성에 있으며, 구체적인 단계는 다음과 같습니다.

기능 1: 지능형 문서 처리

PDF 파일 업로드::
- PDF 파일(예: 학술 논문 또는 보고서)을 준비하여 프로젝트 디렉터리의 지정된 폴더(또는 명시적으로 지정되지 않은 경우 루트 디렉터리에 직접)에 넣습니다.
- 예를 들어 프로그램 인터페이스(또는 버전에 따라 명령줄)에 파일 경로를 입력합니다:input.pdf.
텍스트 추출 및 정리::
- 이 프로그램은 PDF에서 텍스트를 자동으로 추출하고 여분의 줄 바꿈, 공백 또는 서식 오류를 제거합니다.
- 수학 공식이 포함된 문서의 경우, 이 도구는 콘텐츠의 무결성을 보장하기 위해 공식의 구조를 보존하려고 노력합니다.
결과 보기::
- 처리된 텍스트는 일반 텍스트 파일로 저장됩니다(예 output.txt)을 클릭하거나 다음 단계를 위해 인터페이스에 바로 표시할 수 있습니다.

기능 2: 지능형 청크

적용 가능한 시나리오업로드된 PDF가 수천 단어를 초과하면 프로그램이 자동으로 압축합니다.
절차::
1. 프로그램을 실행할 때 청크 매개변수(예: 청크당 5000단어)를 지정합니다. 예제 명령:
```
python main.py --chunk-size 5000 input.pdf
```
2. 청크된 콘텐츠는 여러 파일로 순서대로 저장됩니다(예 chunk1.txt및chunk2.txt)를 클릭하여 쉽게 후속 조치를 취할 수 있습니다.
주의최대 100,000단어 지원, 파일이 너무 큰 경우 미리 분할하는 것이 좋습니다.

기능 3: 멀티 모드 콘텐츠 생성

출력 형식 선택::
- 이 프로그램은 팟캐스트, 인터뷰 등 15가지 모드를 지원합니다. 런타임은 다음과 같은 매개 변수로 지정됩니다:
```
python main.py --mode podcast input.txt
```
콘텐츠 생성::
- 프로그램은 추출된 텍스트를 기반으로 해당 형식의 콘텐츠를 생성합니다(예: 팟캐스트 모드는 2인 대화를 시뮬레이션합니다).
- 생성된 결과는 일반적으로 오디오 파일로 저장됩니다(예 output.mp3) 또는 텍스트 스크립트( script.txt).
재생 또는 편집::
- 오디오 플레이어(예: VLC)를 사용하여 생성된 파일을 엽니다. .mp3 파일로 이동하거나 텍스트 편집기로 스크립트를 조정하여 다시 생성합니다.

작동 팁 및 주의사항

환경 요구 사항파이썬 버전이 3.8 이상이어야 하며, ffmpeg(오디오 처리용)를 권장하고 Linux 사용자가 사용할 수 있어야 합니다. sudo apt install ffmpegWindows 사용자의 경우 환경 변수를 다운로드하여 구성해야 합니다.
파일 경로인코딩 오류를 방지하려면 파일 경로를 입력할 때 중국어 경로를 사용하지 마세요.
문제 디버깅오류가 발생하면 종속성이 완전히 설치되었는지 확인하거나 GitHub 이슈 페이지에서 커뮤니티 도움말을 확인하세요.
확장된 기능프로그래밍에 익숙한 사용자는 코드를 수정하여 사용자 지정 출력 형식을 추가할 수 있으며, 프로젝트의 오픈 소스 특성 덕분에 이를 위한 무한한 가능성을 제공합니다.

이 단계를 통해 PDF 문서를 팟캐스트나 다른 형태의 콘텐츠로 쉽게 변환하고 현지화된 지능형 처리 환경을 즐길 수 있습니다. 학술 연구든 아이디어 창출이든, 로컬 노트북LM은 여러분의 오른손이 되어줄 수 있습니다.