FoleyCrafter: añade sonido sincronizado a un vídeo mudo
Últimos recursos sobre IAActualizado hace 8 meses Círculo de intercambio de inteligencia artificial 2.4K 00
Introducción general
FoleyCrafter es un proyecto de código abierto desarrollado por OpenMMLab para generar efectos de sonido vívidos y sincronizados para vídeos mudos. El proyecto utiliza técnicas avanzadas de inteligencia artificial para analizar el contenido de los vídeos y generar efectos de sonido semánticamente relevantes y sincronizados en el tiempo para mejorar el realismo y la profundidad emocional del vídeo.El objetivo de FoleyCrafter es ofrecer soluciones de sonido de alta calidad para películas, juegos y otros campos con el fin de mejorar la experiencia audiovisual del público.
Síntesis automatizada de flujos de trabajo de locución: https://openart.ai/workflows/t8star/foleycrafter/wZyBSeaa2lvgU3c3NlcH

Lista de funciones
- Generación de vídeo a audioGeneración de efectos sonoros semánticamente relevantes y sincronizados a partir de contenidos de vídeo.
- Generación de sonido de alerta de texto: Genera efectos de sonido específicos para cada escena a partir de pistas de texto.
- alineación temporalAsegúrate de que los efectos de sonido generados están sincronizados con el contenido del vídeo.
- Interfaz Gradio: Proporciona una interfaz fácil de usar para las operaciones de generación de sonido.
- código abierto: Se proporciona una base de código completa para facilitar el desarrollo secundario y la personalización por parte de los desarrolladores.
Utilizar la ayuda
Proceso de instalación
- Preparar el entorno::
- Instala el entorno Conda:
conda env create -f requirements/environment.yaml
- Activar el entorno:
conda activate foleycrafter
- Instala Git LFS:
conda install git-lfs
y luego ejecutegit lfs install
- Instala el entorno Conda:
- Descargar Puntos de control::
- estar en movimiento
inference.py
Descargue automáticamente los puntos de control, o descárguelos manualmente y colóquelos en elcheckpoints
Catálogo.
- estar en movimiento
- Inicio de la interfaz de Gradio::
- estar en movimiento
python app.py --share
Inicie la interfaz de Gradio.
- estar en movimiento
Proceso de utilización
- Generación de vídeo a audio::
- estar en movimiento
python inference.py --save_dir=output/sora/
guarda el archivo de audio generado en el directorio especificado.
- estar en movimiento
- alineación temporal::
- estar en movimiento
python inference.py --temporal_align --input=input/avsync --save_dir=output/avsync/
Los efectos sonoros generados se sincronizan con el tiempo del contenido del vídeo.
- estar en movimiento
- Generación de sonido de alerta de texto::
- estar en movimiento
python inference.py --input=input/PromptControl/case1/ --seed=10201304011203481429 --prompt='noisy, people talking' --save_dir=output/PromptControl/case1_prompt/
Los efectos sonoros de una escena concreta se generan a partir de pistas textuales.
- estar en movimiento
Pasos detallados
- Preparar el entorno::
- Descargue e instale Conda: https://docs.conda.io/en/latest/miniconda.html
- Clona el código del proyecto:
git clone https://github.com/open-mmlab/foleycrafter.git
- Vaya al catálogo de proyectos:
cd foleycrafter
- Siga los pasos anteriores para instalar las dependencias y configurar el entorno.
- Descargar Puntos de control::
- Descargue y coloque el archivo de punto de control, asegurándose de que la estructura de directorios es la siguiente:
└── checkpoints ├── semantic │ ├── semantic_adapter.bin ├── vocoder │ ├── vocoder.pt │ ├── config.json ├── temporal_adapter.ckpt │ └── timestamp_detector.pth.tar
- Inicio de la interfaz de Gradio::
- estar en movimiento
python app.py --share
Inicia la interfaz de Gradio, a la que el usuario puede acceder a través de un navegador.
- estar en movimiento
- Generar efectos de sonido::
- Selecciona distintos modos de generación (vídeo a audio, alineación temporal, cue de texto) y ejecuta los comandos correspondientes para generar archivos de sonido según tus necesidades.
Con los pasos anteriores, los usuarios pueden empezar fácilmente a utilizar FoleyCrafter para añadir efectos de sonido vívidos y sincronizados a los vídeos mudos para mejorar la experiencia audiovisual. /n
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...