논문 검토기: arXiv 논문에 대한 종합적인 리뷰를 자동으로 생성하고 블로그 게시물로 변환합니다.

최신 AI 리소스9개월 전에 게시 됨 AI 공유 서클
2.4K 00

일반 소개

논문 리뷰어는 arXiv 논문에서 종합적인 리뷰를 생성하고 이를 블로그 게시물로 전환하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 블로그 게시물을 자동으로 생성하기 위해 Hugging Face의 데일리 페이퍼 웹사이트를 지원합니다. 파이썬 스크립트 collect.py 및 convert.py를 사용하여 사용자는 논문 리뷰를 수집하고 이를 고정된 디자인 템플릿 블로그 게시물로 변환할 수 있습니다.

Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章

 

기능 목록

기능: 1, 콘텐츠 처리, 텍스트 내용을 읽고, 종이에서 차트, 그림, 표를 추출 할 수 있습니다 2, 종이 ID, 완전 자동 처리 및 생성, 종이의 일괄 처리 지원 3, 사용자 정의 지원, AI 구문 분석 도구, 블로그 템플릿 등을 지원합니다.

  • 종합 리뷰 생성: 주어진 arXiv 논문 ID로 자세한 리뷰를 생성합니다.
  • 블로그 게시물로 변환: 생성된 리뷰 콘텐츠를 고정된 디자인 템플릿에 따라 블로그 게시물로 변환합니다.
  • 다중 API 지원: 업스테이지 및 쌍둥이자리 API를 사용하여 이미지 및 시각적 정보를 추출합니다.
  • 프로세스 자동화: 스크립트를 통해 수집 및 변환 프로세스를 자동화하여 수동 개입을 줄입니다.
  • 유연한 구성: 사용자가 필요에 따라 조정할 수 있는 다양한 구성 옵션을 지원합니다.

 

도움말 사용

설치 프로세스

  1. 종속성 설치::
    • pip를 사용하여 프로젝트에 필요한 Python 종속 요소를 설치합니다:
      pip install -r requirements.txt
      
    • PDF를 이미지로 변환하려면 팝플러를 설치하세요:
      • 우분투 사용자의 경우 다음 명령을 사용하세요:
        apt install poppler-utils
        
      • macOS 사용자의 경우 홈브루를 사용하여 설치하세요:
        brew install poppler
        
  2. 환경 변수 설정::
    • GEMINI_API_KEY를 설정합니다(필수):
      export GEMINI_API_KEY="your_gemini_api_key"
      
    • 선택적으로 Upstage 및 R2의 API 키를 설정합니다:
      export UPSTAGE_API_KEY="your_upstage_api_key"
      export R2_ACCESS_KEY_ID="your_r2_access_key_id"
      export R2_SECRET_ACCESS_KEY="your_r2_secret_access_key"
      export R2_S3_ENDPOINT_URL="your_r2_s3_endpoint_url"
      export R2_DOMAIN_NAME="your_r2_domain_name"
      

사용 프로세스

  1. 검토할 논문 모음::
    • collect.py 스크립트를 실행하여 arXiv ID가 주어진 논문에 대한 리뷰를 생성합니다:
      python collect.py --arxiv-id "your_arxiv_id" --stop-at-no-html
      
    • 이미지 정보를 추출해야 하는 경우 --사용-업스테이지 옵션을 사용할 수 있습니다:
      python collect.py --arxiv-id "your_arxiv_id" --use-upstage
      
  2. 블로그 게시물로 변환::
    • convert.py 스크립트를 실행하여 수집된 리뷰를 블로그 게시물로 변환합니다:
      python convert.py --arxiv-id "your_arxiv_id" --template "your_template_file"
      
    • R2에 이미지를 업로드해야 하는 경우 --upload-images-r2 옵션을 사용할 수 있습니다:
      python convert.py --arxiv-id "your_arxiv_id" --upload-images-r2
      

주의

  • 템플릿 사용자 지정블로그 게시물은 고정된 디자인 템플릿을 따르며, 디자인을 사용자 정의해야 하는 경우 템플릿 파일을 직접 수정해야 합니다.
  • 비용 관리HTML 페이지가 없는 문서를 처리할 때 비용을 줄이려면 --stop-at-no-html 옵션을 사용하는 것이 좋습니다.
  • API 사용업스테이지 및 Gemini API 이미지 정보를 더 정확하게 추출할 수 있지만 추가 비용이 발생할 수 있습니다.

위의 단계를 통해 사용자는 arXiv 논문에서 종합적인 리뷰를 쉽게 생성하고 학술 연구 및 블로그 글쓰기 등 다양한 시나리오에 맞게 블로그 게시물로 전환할 수 있습니다.

© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...