Introdução geral
O Podcastfy é um pacote de software Python de código aberto que usa a tecnologia GenAI (Generative Artificial Intelligence) para converter conteúdo da Web, arquivos PDF, texto, imagens, vídeos do YouTube e muitas outras fontes em diálogos de áudio multilíngues envolventes. Diferentemente das ferramentas tradicionais baseadas em UI, o Podcastfy se concentra na geração programática e personalizada para usuários que precisam de geração de conteúdo de áudio personalizado e em escala.
Lista de funções
- Converta conteúdo de várias fontes (por exemplo, páginas da Web, PDFs, texto, vídeos do YouTube, imagens) em diálogos de áudio em vários idiomas
- Suporte para transcrição personalizada e geração de áudio (por exemplo, estilo, idioma, estrutura, duração)
- Criação de podcasts a partir de transcrições pré-existentes ou editadas
- Suporte para modelagem avançada de conversão de texto em fala (por exemplo, OpenAI, ElevenLabs e Edge)
- Oferece suporte à execução de LLMs locais para gerar transcrições (melhora a privacidade e o controle)
- Integração perfeita da CLI e do pacote Python para automação do fluxo de trabalho
- Suporte multilíngue para criação de conteúdo global (experimental)
Usando a Ajuda
Processo de instalação
- Certifique-se de que você tenha o Python 3.7 ou superior instalado.
- Instale o Podcastfy usando o pip:
pip install podcastfy
- Instale os pacotes de dependência necessários:
pip install -r requirements.txt
Processo de uso
- Uso básico::
- Importe o pacote Podcastfy:
importação podcastfy
- Carregar conteúdo e gerar áudio:
content = podcastfy.load_content('caminho/para/seu/conteúdo') audio = podcastfy.generate_audio(content, language='en') podcastfy.save_audio(audio, 'output/path')
- Importe o pacote Podcastfy:
- Geração personalizada::
- Personalize os parâmetros de transcrição e geração de áudio:
audio = podcastfy.generate_audio(content, language='en', style="conversacional, length="curto)
- Personalize os parâmetros de transcrição e geração de áudio:
- Suporte a vários idiomas::
- Gerar áudio multilíngue:
audio_fr = podcastfy.generate_audio(content, language='fr') audio_pt = podcastfy.generate_audio(content, language='pt-BR')
- Gerar áudio multilíngue:
- Recursos avançados::
- Gerar transcrições usando LLMs nativos:
transcrição = podcastfy.generate_transcript(content, use_local_llm=Verdadeiro) audio = podcastfy.generate_audio(transcript)
- Gerar transcrições usando LLMs nativos:
- Fluxo de trabalho automatizado::
- Use a ferramenta CLI:
podcastfy --input path/to/content --output path/to/output --language en
- Use a ferramenta CLI:
Procedimento de operação detalhado
- Carregando conteúdo::
- Oferece suporte a várias fontes de conteúdo, incluindo páginas da Web, PDFs, textos, vídeos do YouTube e imagens. Use
load_content
para carregar o conteúdo. - Exemplo:
content = podcastfy.load_content('https://example.com')
- Oferece suporte a várias fontes de conteúdo, incluindo páginas da Web, PDFs, textos, vídeos do YouTube e imagens. Use
- Gerar áudio::
- fazer uso de
generate_audio
para gerar áudio. Parâmetros como idioma, estilo, duração etc. podem ser especificados. - Exemplo:
audio = podcastfy.generate_audio(content, language='en', style="narrativa, length='longo')
- fazer uso de
- Salvar áudio::
- fazer uso de
save_audio
para salvar o arquivo de áudio gerado. - Exemplo:
podcastfy.save_audio(audio, 'output/audio.mp3')
- fazer uso de
- Transcrição personalizada::
- fazer uso de
gerar_transcrição
para gerar transcrições personalizadas. Opcionalmente, os LLMs locais podem ser usados para aumentar a privacidade e o controle. - Exemplo:
transcrição = podcastfy.generate_transcript(content, use_local_llm=Verdadeiro)
- fazer uso de
- Suporte a vários idiomas::
- Suporte para geração de áudio multilíngue para criação de conteúdo global.
- Exemplo:
audio_fr = podcastfy.generate_audio(content, language='fr') audio_pt = podcastfy.generate_audio(content, language='pt-BR')
Com essas etapas, os usuários podem converter facilmente o conteúdo de várias fontes em diálogo de áudio multilíngue para criar conteúdo de podcast personalizado e envolvente.