Podcastfy: Herramienta de conversión de contenidos de múltiples fuentes a audio multilingüe, una alternativa de código abierto a las funciones de podcasting de NotebookLM.

Introducción general

Podcastfy es un paquete de software Python de código abierto que utiliza tecnología de Inteligencia Artificial Generativa (GenAI) para convertir contenidos web, archivos PDF, texto, imágenes, vídeos de youtube y muchas otras fuentes en atractivos diálogos de audio multilingües. A diferencia de las herramientas tradicionales basadas en la interfaz de usuario, Podcastfy se centra en la generación programática y personalizada para usuarios que necesitan una generación de contenidos de audio personalizada y a escala.

Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

Interfaz de demostración: https://huggingface.co/spaces/thatupiso/Podcastfy.ai_demo

 

Lista de funciones

  • Convierta contenidos de múltiples fuentes (por ejemplo, páginas web, PDF, texto, vídeos de YouTube, imágenes) en diálogos de audio multilingües.
  • Soporte para transcripción personalizada y generación de audio (por ejemplo, estilo, idioma, estructura, longitud).
  • Creación de podcasts a partir de transcripciones preexistentes o editadas
  • Compatibilidad con modelado avanzado de texto a voz (por ejemplo, OpenAI, ElevenLabs y Edge)
  • Admite la ejecución local de LLM para generar transcripciones (mejora la privacidad y el control)
  • Perfecta integración de paquetes CLI y Python para la automatización del flujo de trabajo
  • Soporte multilingüe para la creación global de contenidos (experimental)

 

Utilizar la ayuda

Proceso de instalación

  1. Asegúrese de tener instalado Python 3.7 o superior.
  2. Instala Podcastfy usando pip:
    pip install podcastfy
    
  3. Instale los paquetes de dependencias necesarios:
    pip install -r requirements.txt
    

Proceso de utilización

  1. Uso básico::
    • Importa el paquete Podcastfy:
      import podcastfy
      
    • Carga contenidos y genera audio:
      content = podcastfy.load_content('path/to/your/content')
      audio = podcastfy.generate_audio(content, language='en')
      podcastfy.save_audio(audio, 'output/path')
      
  2. Generación personalizada::
    • Personalice los parámetros de transcripción y generación de audio:
      audio = podcastfy.generate_audio(content, language='en', style='conversational', length='short')
      
  3. Soporte multilingüe::
    • Genera audio multilingüe:
      audio_fr = podcastfy.generate_audio(content, language='fr')
      audio_pt = podcastfy.generate_audio(content, language='pt-BR')
      
  4. Funciones avanzadas::
    • Generar transcripciones utilizando LLM nativos:
      transcript = podcastfy.generate_transcript(content, use_local_llm=True)
      audio = podcastfy.generate_audio(transcript)
      
  5. Flujo de trabajo automatizado::
    • Utilice la herramienta CLI:
      podcastfy --input path/to/content --output path/to/output --language en
      

Procedimiento de funcionamiento detallado

  1. Cargar contenido::
    • Admite múltiples fuentes de contenido, como páginas web, PDF, texto, vídeos de YouTube e imágenes. Utilice load_content para cargar el contenido.
    • Ejemplo:
      content = podcastfy.load_content('https://example.com')
      
  2. Generar audio::
    • utilizar generate_audio para generar audio. Se pueden especificar parámetros como el idioma, el estilo, la duración, etc.
    • Ejemplo:
      audio = podcastfy.generate_audio(content, language='en', style='narrative', length='long')
      
  3. Guardar audio::
    • utilizar save_audio para guardar el archivo de audio generado.
    • Ejemplo:
      podcastfy.save_audio(audio, 'output/audio.mp3')
      
  4. Transcripción personalizada::
    • utilizar generate_transcript método para generar transcripciones personalizadas. Opción de utilizar LLM nativos para aumentar la privacidad y el control.
    • Ejemplo:
      transcript = podcastfy.generate_transcript(content, use_local_llm=True)
      
  5. Soporte multilingüe::
    • Soporte para generar audio multilingüe para la creación de contenidos globales.
    • Ejemplo:
      audio_fr = podcastfy.generate_audio(content, language='fr')
      audio_pt = podcastfy.generate_audio(content, language='pt-BR')
      

Con estos pasos, los usuarios pueden convertir fácilmente contenidos de múltiples fuentes en diálogos de audio multilingües para crear contenidos de podcast personalizados y atractivos.

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...