로컬-NotebookLM: 오픈 소스 도구의 음성 팟캐스트를 생성하는 로컬 PDF

최신 AI 리소스5개월 전에 게시 됨 AI 공유 서클
2.1K 00

일반 소개

로컬에서 실행되는 지능형 문서 처리 및 콘텐츠 생성 도구를 제공하는 것을 목표로 하는 오픈 소스 프로젝트인 Local-NotebookLM입니다. 이 프로젝트는 Google 노트북LM 이 프로젝트는 괴크데니즈 귈메즈의 작업에서 영감을 얻은 것으로, 사용자가 PDF와 같은 문서를 팟캐스트, 인터뷰, 강의 등 다양한 출력 형식으로 변환할 수 있도록 지원하는 동시에 데이터 개인정보 보호를 위해 로컬 배포를 지원하는 데 중점을 두고 있습니다. 개발자인 괴크데니즈 귈메즈는 GitHub에서 프로젝트를 유지 관리하며 명확한 설치 단계와 지침을 제공합니다. 학술 논문과 같은 복잡한 문서, 최대 10만 단어, 지능형 청킹을 지원하는 이 프로젝트는 문서를 효율적으로 분석하거나 창의적인 콘텐츠를 생성해야 하는 사용자에게 이상적입니다. 학생, 연구원, 콘텐츠 제작자 등 누구나 쉽게 문서를 오디오로 변환하거나 다양한 모드로 표현할 수 있습니다. Local-NotebookLM:本地PDF生成语音播客的开源工具

 

기능 목록

  • 지능형 문서 처리PDF 텍스트 자동 추출, 서식 오류 정리, 수학 공식이 포함된 학술 논문 지원.
  • 지능형 청크대용량 파일을 관리하기 쉬운 세그먼트로 분할하여 최대 100,000단어까지 문서를 지원합니다.
  • 멀티모달 콘텐츠 생성팟캐스트, 인터뷰, 토론, 강의 등 15가지 출력 형식을 사용할 수 있습니다.
  • 로컬 런타임 지원클라우드 서비스에 의존할 필요 없이 모든 처리가 사용자 기기에서 이루어지므로 데이터 보안이 보장됩니다.
  • 오픈 소스 및 무료코드가 공개되어 있으며 사용자는 자유롭게 다운로드, 수정 및 기여할 수 있습니다.

 

도움말 사용

설치 프로세스

로컬에서 Local-NotebookLM을 사용하려면 아래 단계에 따라 환경을 구성하고 프로젝트를 실행해야 합니다. 아래는 빠르게 시작하고 실행할 수 있도록 자세한 설치 가이드입니다.

1. 창고 복제

먼저 장치에 Git이 설치되어 있는지 확인합니다. 터미널(Windows 사용자의 경우 명령 프롬프트 또는 PowerShell)을 열고 다음 명령을 입력하여 프로젝트를 로컬로 복제합니다:

git clone https://github.com/Goekdeniz-Guelmez/Local-NotebookLM.git

완료되면 프로젝트 카탈로그로 이동합니다:

cd Local-NotebookLM

2. 가상 환경 생성

종속성 충돌을 피하려면 Python 가상 환경을 사용하는 것이 좋습니다. 다음 명령을 실행하여 생성하고 활성화합니다:

  • Linux/macOS::
python -m venv venv
source venv/bin/activate
  • Windows(컴퓨터)::
python -m venv venv
venv\Scripts\activate

활성화 후 터미널 프롬프트 앞에 다음이 표시됩니다. (venv)를 클릭하여 가상 환경이 입력되었음을 나타냅니다.

3. 종속성 설치

프로젝트 종속성은 다음 항목에 나열됩니다. requirements.txt 파일로 이동합니다. 다음 명령을 실행하여 필요한 모든 라이브러리를 설치합니다:

pip install -r requirements.txt

설치 과정은 네트워크 속도에 따라 몇 분 정도 걸릴 수 있습니다. 설치가 완료되면 pip list 설치가 성공적으로 완료되었는지 확인합니다.

4. 프로젝트 실행

설치가 완료되면 메인 프로그램 파일을 직접 실행합니다( main.py(정확한 파일명은 최신 버전의 GitHub를 기준으로 합니다):

python main.py

모든 것이 순조롭게 진행되면 프로그램이 시작되고 Local-NotebookLM을 사용할 수 있습니다.

주요 기능 사용 방법

Local-NotebookLM의 핵심은 문서 처리와 콘텐츠 생성에 있으며, 구체적인 단계는 다음과 같습니다.

기능 1: 지능형 문서 처리

  1. PDF 파일 업로드::
    • PDF 파일(예: 학술 논문 또는 보고서)을 준비하여 프로젝트 디렉터리의 지정된 폴더(또는 명시적으로 지정되지 않은 경우 루트 디렉터리에 직접)에 넣습니다.
    • 예를 들어 프로그램 인터페이스(또는 버전에 따라 명령줄)에 파일 경로를 입력합니다:input.pdf.
  2. 텍스트 추출 및 정리::
    • 이 프로그램은 PDF에서 텍스트를 자동으로 추출하고 여분의 줄 바꿈, 공백 또는 서식 오류를 제거합니다.
    • 수학 공식이 포함된 문서의 경우, 이 도구는 콘텐츠의 무결성을 보장하기 위해 공식의 구조를 보존하려고 노력합니다.
  3. 결과 보기::
    • 처리된 텍스트는 일반 텍스트 파일로 저장됩니다(예 output.txt)을 클릭하거나 다음 단계를 위해 인터페이스에 바로 표시할 수 있습니다.

기능 2: 지능형 청크

  • 적용 가능한 시나리오업로드된 PDF가 수천 단어를 초과하면 프로그램이 자동으로 압축합니다.
  • 절차::
    1. 프로그램을 실행할 때 청크 매개변수(예: 청크당 5000단어)를 지정합니다. 예제 명령:
      python main.py --chunk-size 5000 input.pdf
      
    2. 청크된 콘텐츠는 여러 파일로 순서대로 저장됩니다(예 chunk1.txtchunk2.txt)를 클릭하여 쉽게 후속 조치를 취할 수 있습니다.
  • 주의최대 100,000단어 지원, 파일이 너무 큰 경우 미리 분할하는 것이 좋습니다.

기능 3: 멀티 모드 콘텐츠 생성

  1. 출력 형식 선택::
    • 이 프로그램은 팟캐스트, 인터뷰 등 15가지 모드를 지원합니다. 런타임은 다음과 같은 매개 변수로 지정됩니다:
      python main.py --mode podcast input.txt
      
  2. 콘텐츠 생성::
    • 프로그램은 추출된 텍스트를 기반으로 해당 형식의 콘텐츠를 생성합니다(예: 팟캐스트 모드는 2인 대화를 시뮬레이션합니다).
    • 생성된 결과는 일반적으로 오디오 파일로 저장됩니다(예 output.mp3) 또는 텍스트 스크립트( script.txt).
  3. 재생 또는 편집::
    • 오디오 플레이어(예: VLC)를 사용하여 생성된 파일을 엽니다. .mp3 파일로 이동하거나 텍스트 편집기로 스크립트를 조정하여 다시 생성합니다.

작동 팁 및 주의사항

  • 환경 요구 사항파이썬 버전이 3.8 이상이어야 하며, ffmpeg(오디오 처리용)를 권장하고 Linux 사용자가 사용할 수 있어야 합니다. sudo apt install ffmpegWindows 사용자의 경우 환경 변수를 다운로드하여 구성해야 합니다.
  • 파일 경로인코딩 오류를 방지하려면 파일 경로를 입력할 때 중국어 경로를 사용하지 마세요.
  • 문제 디버깅오류가 발생하면 종속성이 완전히 설치되었는지 확인하거나 GitHub 이슈 페이지에서 커뮤니티 도움말을 확인하세요.
  • 확장된 기능프로그래밍에 익숙한 사용자는 코드를 수정하여 사용자 지정 출력 형식을 추가할 수 있으며, 프로젝트의 오픈 소스 특성 덕분에 이를 위한 무한한 가능성을 제공합니다.

이 단계를 통해 PDF 문서를 팟캐스트나 다른 형태의 콘텐츠로 쉽게 변환하고 현지화된 지능형 처리 환경을 즐길 수 있습니다. 학술 연구든 아이디어 창출이든, 로컬 노트북LM은 여러분의 오른손이 되어줄 수 있습니다.

© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...