Paper Reviewer: Generación automática de reseñas exhaustivas de artículos de arXiv y su conversión en entradas de blog.

Introducción general

Paper Reviewer es un proyecto de código abierto diseñado para generar reseñas exhaustivas de artículos arXiv y convertirlas en entradas de blog. El proyecto es compatible con el sitio web Hugging Face's Daily Papers para generar automáticamente entradas de blog. Mediante el uso de los scripts de Python collect.py y convert.py, los usuarios pueden recopilar reseñas de artículos y convertirlas en entradas de blog con una plantilla de diseño fijo.

Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章

 

Lista de funciones

Características: 1, procesamiento de contenido, puede leer el contenido del texto, extraer los gráficos, imágenes, tablas en el papel 2, siempre y cuando el ID de papel, procesamiento totalmente automático y la generación, el apoyo de procesamiento por lotes del papel 3, el apoyo a la personalización, AI herramientas de análisis, plantillas de blog y así sucesivamente.

  • Generate Comprehensive Review: Genera una reseña detallada a partir de un ID de artículo arXiv dado.
  • Convertir en entradas de blog: convierta el contenido de reseña generado en entradas de blog, siguiendo una plantilla de diseño fija.
  • Compatibilidad con múltiples API: uso opcional de Upstage y Géminis API para extraer imágenes e información visual.
  • Automatizar el proceso: automatizar el proceso de recogida y conversión mediante scripts, reduciendo la intervención manual.
  • Configuración flexible: admite diversas opciones de configuración que los usuarios pueden ajustar según sus necesidades.

 

Utilizar la ayuda

Proceso de instalación

  1. Instalación de dependencias::
    • Utilice pip para instalar las dependencias de Python necesarias para el proyecto:
      pip install -r requirements.txt
      
    • Instala poppler para convertir PDF a imagen:
      • Para los usuarios de Ubuntu, utilice el siguiente comando:
        apt install poppler-utils
        
      • Para los usuarios de macOS, utilice Homebrew para la instalación:
        brew install poppler
        
  2. Configuración de variables de entorno::
    • Establezca GEMINI_API_KEY (obligatorio):
      export GEMINI_API_KEY="your_gemini_api_key"
      
    • Opcionalmente, establezca la clave API para Upstage y R2:
      export UPSTAGE_API_KEY="your_upstage_api_key"
      export R2_ACCESS_KEY_ID="your_r2_access_key_id"
      export R2_SECRET_ACCESS_KEY="your_r2_secret_access_key"
      export R2_S3_ENDPOINT_URL="your_r2_s3_endpoint_url"
      export R2_DOMAIN_NAME="your_r2_domain_name"
      

Proceso de utilización

  1. Recopilación de documentos para revisión::
    • Ejecute el script collect.py para generar una revisión del artículo dado el ID de arXiv:
      python collect.py --arxiv-id "your_arxiv_id" --stop-at-no-html
      
    • Si necesita extraer información de la imagen, puede utilizar la opción --use-upstage:
      python collect.py --arxiv-id "your_arxiv_id" --use-upstage
      
  2. Convertido en entrada de blog::
    • Ejecute el script convert.py para convertir las reseñas recopiladas en entradas de blog:
      python convert.py --arxiv-id "your_arxiv_id" --template "your_template_file"
      
    • Si necesitas subir imágenes a R2, puedes utilizar la opción --upload-images-r2:
      python convert.py --arxiv-id "your_arxiv_id" --upload-images-r2
      

advertencia

  • Personalización de plantillas: Las entradas de blog siguen una plantilla de diseño fija, si necesita personalizar el diseño, deberá modificar el archivo de plantilla usted mismo.
  • control de costesSe recomienda utilizar la opción --stop-at-no-html para reducir costes al procesar documentos sin páginas HTML.
  • Uso de la API: Arriba y API Géminis Proporciona una extracción más precisa de la información de la imagen, pero puede suponer costes adicionales.

Con los pasos anteriores, los usuarios pueden generar fácilmente reseñas exhaustivas a partir de artículos de arXiv y convertirlas en entradas de blog para diversos escenarios, como la investigación académica y la redacción de blogs.

© declaración de copyright
AiPPT

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...