PDF2Audio: PDF를 오디오로 변환하는 도구, PDF를 팟캐스트로 변환하는 도구

최신 AI 리소스12개월 전에 게시됨 AI 공유 서클
20.4K 00
堆友AI

일반 소개

PDF2Audio는 PDF 파일을 팟캐스트, 강의, 요약과 같은 오디오 콘텐츠로 변환하도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 텍스트 생성 및 텍스트 음성 변환을 위해 OpenAI의 GPT 모델을 활용하여 사용자가 여러 PDF 파일을 업로드하고, 다양한 지침 템플릿(예: 팟캐스트, 강의, 요약 등)을 선택하고, 텍스트 생성 및 오디오 모델을 사용자 지정할 수 있습니다. pdf2Audio는 다양한 음성 옵션을 제공하며 사용자가 초안을 편집하고 피드백을 제공하여 오디오 콘텐츠를 반복적으로 개선할 수 있도록 합니다.

추천 관련 항목:NotebookLM: 지식 노트 검색 읽기, 다중 클래스 문서 생성 음성 대화 팟캐스트

 

PDF2Audio:将PDF转换为音频的工具,PDF转播客

 

기능 목록

  • 여러 PDF 파일 업로드
  • 다양한 강의 템플릿(팟캐스트, 강의, 요약 등)을 선택합니다.
  • 사용자 지정 텍스트 생성 및 오디오 모델링
  • 다른 음성 선택
  • 초안을 편집하고 피드백을 제공하여 오디오 콘텐츠를 반복적으로 개선하세요.
  • 로컬 설치 및 사용 지원

 

PDF2Audio 인터페이스

PDF2Audio 인터페이스는 매우 간단하며 단계는 다음과 같습니다:

1. 하나 이상의 PDF 파일을 업로드합니다.
2. 원하는 인스트럭션 템플릿을 선택합니다.

PDF2Audio:将PDF转换为音频的工具,PDF转播客

 

3. 필요한 경우 사용자 지정 지침 템플릿
4. '오디오 생성' 버튼을 클릭하여 오디오 콘텐츠를 생성합니다.

PDF2Audio:将PDF转换为音频的工具,PDF转播客

 

도움말 사용

온라인 경험

https://huggingface.co/spaces/lamm-mit/PDF2Audio

https://colab.research.google.com/github/lamm-mit/PDF2Audio/blob/main/PDF2Audio.ipynb

 

로컬 설치 프로세스

  1. 클론 창고터미널에서 다음 명령을 실행하여 PDF2Audio 리포지토리를 복제합니다:
    git clone https://github.com/lamm-mit/PDF2Audio.git
    cd PDF2Audio
    
  2. 미니콘다 설치미니콘다가 아직 설치되어 있지 않은 경우 미니콘다 웹사이트에서 설치 프로그램을 다운로드하고 운영 체제에 맞는 설치 지침을 따르세요. 설치가 성공적으로 완료되었는지 확인합니다:
    conda --version
    
  3. 콘다 환경 만들기터미널에서 다음 명령을 실행하여 새 Conda 환경을 만듭니다:
    conda create -n pdf2audio python=3.9
    conda activate pdf2audio
    
  4. 종속성 설치터미널에서 다음 명령을 실행하여 필요한 종속성을 설치합니다:
    pip install -r requirements.txt
    
  5. OpenAI API 키 설정만들기 .env 파일을 열고 OpenAI API 키를 추가합니다:
    OPENAI_API_KEY=your_api_key_here
    

사용 프로세스

  1. 애플리케이션 실행프로젝트 디렉토리에 있고 Conda 환경이 활성화되어 있는지 확인합니다:
    conda activate pdf2audio
    python app.py
    
  2. 브라우저 열기터미널에 URL이 제공되며, 보통은 http://localhost:7860URL이 브라우저에서 열려 있으면 해당 URL이 브라우저에서 열립니다.
  3. PDF 파일 업로드Gradio 인터페이스를 사용하여 하나 이상의 PDF 파일을 업로드합니다.
  4. 명령 템플릿 선택하기: 원하는 강의 템플릿(예: 팟캐스트, 강의, 요약 등)을 선택합니다.
  5. 사용자 지정 명령: 필요에 따라 지침을 사용자 지정합니다.
  6. 오디오 생성: '오디오 생성' 버튼을 클릭하여 오디오 콘텐츠를 만듭니다.

주의

  • 앱을 실행하려면 OpenAI API 키가 필요합니다.
  • 초안을 편집하고 구체적이거나 일반적인 피드백을 제공하여 오디오 콘텐츠를 반복적으로 개선할 수 있습니다.
© 저작권 정책

관련 게시물

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...