Podcastfy : Outil de conversation audio multilingue à partir de contenus multisources, une alternative open source aux capacités de podcasting de NotebookLM

Introduction générale

Podcastfy est un logiciel Python open source qui utilise la technologie de l'intelligence artificielle générative (GenAI) pour convertir du contenu web, des fichiers PDF, du texte, des images, des vidéos YouTube et bien d'autres sources en dialogues audio multilingues attrayants. Contrairement aux outils traditionnels basés sur l'interface utilisateur, Podcastfy se concentre sur la génération programmatique et personnalisée pour les utilisateurs qui ont besoin d'une génération de contenu audio personnalisée et à grande échelle.

Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

Interface de démonstration : https://huggingface.co/spaces/thatupiso/Podcastfy.ai_demo

 

Liste des fonctions

  • Convertir des contenus provenant de sources multiples (pages web, PDF, textes, vidéos YouTube, images) en dialogues audio multilingues.
  • Prise en charge de la transcription personnalisée et de la génération audio (par exemple, le style, la langue, la structure, la longueur)
  • Création de podcasts à partir de transcriptions préexistantes ou éditées
  • Prise en charge de la modélisation avancée de la synthèse vocale (par exemple, OpenAI, ElevenLabs et Edge)
  • Soutien aux LLM locaux fonctionnant pour générer des transcriptions (amélioration de la confidentialité et du contrôle)
  • Intégration transparente de l'interface de programmation et des paquets Python pour l'automatisation des flux de travail
  • Support multilingue pour la création de contenu global (expérimental)

 

Utiliser l'aide

Processus d'installation

  1. Assurez-vous que Python 3.7 et plus est installé.
  2. Installez Podcastfy en utilisant pip :
    pip install podcastfy
    
  3. Installez les paquets de dépendances nécessaires :
    pip install -r requirements.txt
    

Processus d'utilisation

  1. Utilisation de base: :
    • Importer le paquet Podcastfy :
      import podcastfy
      
    • Charger du contenu et générer de l'audio :
      content = podcastfy.load_content('path/to/your/content')
      audio = podcastfy.generate_audio(content, language='en')
      podcastfy.save_audio(audio, 'output/path')
      
  2. Génération personnalisée: :
    • Personnalisation des paramètres de transcription et de génération audio :
      audio = podcastfy.generate_audio(content, language='en', style='conversational', length='short')
      
  3. Prise en charge multilingue: :
    • Générer un son multilingue :
      audio_fr = podcastfy.generate_audio(content, language='fr')
      audio_pt = podcastfy.generate_audio(content, language='pt-BR')
      
  4. Fonctionnalités avancées: :
    • Générer des transcriptions à l'aide de LLM natifs :
      transcript = podcastfy.generate_transcript(content, use_local_llm=True)
      audio = podcastfy.generate_audio(transcript)
      
  5. Flux de travail automatisé: :
    • Utilisez l'outil CLI :
      podcastfy --input path/to/content --output path/to/output --language en
      

Procédure d'utilisation détaillée

  1. Chargement du contenu: :
    • Prise en charge de plusieurs sources de contenu, notamment les pages web, les PDF, le texte, les vidéos YouTube et les images. Utiliser load_content pour charger le contenu.
    • Exemple :
      content = podcastfy.load_content('https://example.com')
      
  2. Générer de l'audio: :
    • utiliser generate_audio pour générer de l'audio. Des paramètres tels que la langue, le style, la longueur, etc. peuvent être spécifiés.
    • Exemple :
      audio = podcastfy.generate_audio(content, language='en', style='narrative', length='long')
      
  3. Sauvegarder l'audio: :
    • utiliser save_audio pour enregistrer le fichier audio généré.
    • Exemple :
      podcastfy.save_audio(audio, 'output/audio.mp3')
      
  4. Transcription personnalisée: :
    • utiliser generate_transcript pour générer des transcriptions personnalisées. En option, des LLM locaux peuvent être utilisés pour améliorer la confidentialité et le contrôle.
    • Exemple :
      transcript = podcastfy.generate_transcript(content, use_local_llm=True)
      
  5. Prise en charge multilingue: :
    • Prise en charge de la génération d'audio multilingue pour la création de contenu global.
    • Exemple :
      audio_fr = podcastfy.generate_audio(content, language='fr')
      audio_pt = podcastfy.generate_audio(content, language='pt-BR')
      

Grâce à ces étapes, les utilisateurs peuvent facilement convertir du contenu provenant de sources multiples en dialogue audio multilingue afin de créer des podcasts personnalisés et attrayants.

© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...