Aprendizagem pessoal com IA
e orientação prática

FoleyCrafter: Adicionando som sincronizado e vívido a um vídeo silencioso

Introdução geral

O FoleyCrafter é um projeto de código-fonte aberto desenvolvido pelo OpenMMLab para gerar efeitos sonoros vívidos e sincronizados para vídeos silenciosos. O projeto usa técnicas avançadas de inteligência artificial para analisar o conteúdo do vídeo e gerar efeitos sonoros semanticamente relevantes e sincronizados com o tempo para aprimorar o realismo e a profundidade emocional do vídeo. O objetivo do FoleyCrafter é fornecer soluções de som de alta qualidade para filmes, jogos e outros campos para aprimorar a experiência audiovisual do público.

Síntese automatizada de fluxos de trabalho de locução: https://openart.ai/workflows/t8star/foleycrafter/wZyBSeaa2lvgU3c3NlcH


FoleyCrafter: Adicionando som sincronizado e vívido a um vídeo silencioso-1

 

Lista de funções

  • Geração de vídeo para áudioGeração de efeitos sonoros semanticamente relevantes e sincronizados com base no conteúdo do vídeo.
  • Geração de som de alerta de textoGeração de efeitos sonoros específicos de cenas a partir de dicas de texto.
  • alinhamento de tempoEfeitos sonoros: Certifique-se de que os efeitos sonoros gerados estejam sincronizados com o tempo do conteúdo do vídeo.
  • Interface do GradioInterface de usuário: fornece uma interface amigável para operações de geração de som.
  • código abertoBase de código: Uma base de código completa é fornecida para facilitar o desenvolvimento secundário e a personalização pelos desenvolvedores.

 

Usando a Ajuda

Processo de instalação

  1. Preparação do ambiente::
    • Instale o ambiente Conda:conda env create -f requirements/environment.yaml
    • Ativar o ambiente:conda activate foleycrafter
    • Instale o Git LFS:conda install git-lfse, em seguida, execute git lfs install
  2. Baixar pontos de controle::
    • estar em movimento inference.py Faça o download automático dos pontos de controle ou faça o download manual e coloque-os no pontos de controle Catálogo.
  3. Iniciando a interface do Gradio::
    • estar em movimento python app.py --share Inicie a interface do Gradio.

Processo de uso

  1. Geração de vídeo para áudio::
    • estar em movimento python inference.py --save_dir=output/sora/Salve o arquivo de áudio gerado no diretório especificado.
  2. alinhamento de tempo::
    • estar em movimento python inference.py --temporal_align --input=input/avsync --save_dir=output/avsync/Os efeitos sonoros gerados são sincronizados com o tempo do conteúdo do vídeo.
  3. Geração de som de alerta de texto::
    • estar em movimento python inference.py --input=input/PromptControl/case1/ --seed=10201304011203481429 --prompt='noisy, people talking' --save_dir=output/ PromptControl/case1_prompt/Os efeitos sonoros são gerados para cenas específicas com base em dicas textuais.

Etapas detalhadas

  1. Preparação do ambiente::
    • Faça o download e instale o Conda: https://docs.conda.io/en/latest/miniconda.html
    • Clone o código do projeto:git clone https://github.com/open-mmlab/foleycrafter.git
    • Vá para o catálogo de projetos:cd foleycrafter
    • Siga as etapas acima para instalar as dependências e configurar o ambiente.
  2. Baixar pontos de controle::
    • Faça o download e coloque o arquivo de ponto de verificação, certificando-se de que a estrutura do diretório seja a seguinte:
     └── pontos de controle
    ├── semântica
    ├─── semantic_adapter.bin
    ├─── vocoder
    │ ├─── vocoder.pt
    │ ├─── config.json
    Temporal_adapter.ckpt
    │ └── timestamp_detector.pth.tar
    
  3. Iniciando a interface do Gradio::
    • estar em movimento python app.py --share Inicia a interface do Gradio, que pode ser acessada pelo usuário por meio de um navegador.
  4. Gerar efeitos sonoros::
    • Selecione diferentes modos de geração (vídeo para áudio, alinhamento de tempo, sinalização de texto) e execute os comandos correspondentes para gerar arquivos de som de acordo com suas necessidades.

Com as etapas acima, os usuários podem começar a usar facilmente o FoleyCrafter para adicionar efeitos sonoros vívidos e sincronizados a vídeos silenciosos para aprimorar a experiência audiovisual. /n

Aprendizagem fácil com IA

O guia do leigo para começar a usar a IA

Ajuda você a aprender a utilizar as ferramentas de IA com baixo custo e a partir de uma base zero.A IA, assim como o software de escritório, é uma habilidade essencial para todos. Dominar a IA lhe dará uma vantagem em sua busca de emprego e metade do esforço em seu trabalho e estudos futuros.

Ver detalhes>
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " FoleyCrafter: Adicionando som sincronizado e vívido a um vídeo silencioso

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil