Open NotebookLM: convierta PDF en podcasts de herramientas de código abierto
Últimos recursos sobre IAPublicado hace 6 meses Círculo de intercambio de inteligencia artificial 2.1K 00
Introducción general
Abrir CuadernoLM es un proyecto de código abierto diseñado para convertir cualquier documento PDF en un podcast. La herramienta utiliza modelos de código abierto Large Language Models (LLM) y Text-to-Speech (TTS) para procesar contenidos PDF, generar diálogos naturales adecuados para podcasts de audio y convertirlos en archivos MP3. Inspirado en la herramienta NotebookLM, el proyecto utiliza tecnologías como Llama 3.3 70B, Fireworks AI, MeloTTS, Bark y Jina Reader. Los usuarios pueden cargar documentos PDF a través de una sencilla interfaz para generar diálogos de podcast informativos e interesantes.

Lista de funciones
- PDF a PodcastCarga un documento PDF para convertir su contenido en un diálogo de podcast.
- Generación natural de diálogos: Genera diálogos informativos diseñados para ser a la vez educativos y entretenidos.
- interfaz fácil de usar: Utiliza Gradio para proporcionar una interfaz interactiva sencilla.
- Soporte multilingüeGeneración de podcasts en 13 idiomas.
Utilizar la ayuda
Proceso de instalación
- Almacén de clonación:
git clone https://github.com/gabrielchua/open-notebooklm.git
cd open-notebooklm
- Crea un entorno virtual y actívalo:
python -m venv .venv
source .venv/bin/activate
- Instale los paquetes necesarios:
pip install -r requirements.txt
Proceso de utilización
- Establezca la clave API:
- Establecer la clave API de Fireworks como variable de entorno
FIREWORKS_API_KEY
.
- Establecer la clave API de Fireworks como variable de entorno
- Ejecuta la aplicación:
python app.py
Se abrirá la interfaz de Gradio.
- Cargar PDF:
- Cargue el documento PDF que desea convertir en podcast en la interfaz.
- Generar audio:
- Haz clic en el botón para iniciar el proceso de conversión y el resultado será un archivo MP3 con el diálogo del podcast.
Flujo detallado de funcionamiento de las funciones
- Subir PDF: Seleccione y cargue archivos PDF en la interfaz de Gradio.
- Generación de diálogosEl sistema procesará automáticamente los contenidos PDF para generar un diálogo natural.
- salida de audioHaga clic en el botón Generar y el sistema generará el archivo podcast en formato MP3.
- Soporte multilingüe: Seleccione el idioma deseado en los ajustes y el sistema generará el podcast en el idioma adecuado según la selección.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...