FoleyCrafter: добавление яркого синхронизированного звука в беззвучное видео
Общее введение
FoleyCrafter - это проект с открытым исходным кодом, разработанный OpenMMLab для создания ярких и синхронизированных звуковых эффектов для немого видео. Проект использует передовые методы искусственного интеллекта для анализа видеоконтента и генерации семантически релевантных и синхронизированных по времени звуковых эффектов для повышения реалистичности и эмоциональной глубины видео. Цель FoleyCrafter - предоставить высококачественные звуковые решения для фильмов, игр и других областей, чтобы улучшить аудиовизуальное восприятие зрителей.
Автоматизированный синтез рабочих процессов озвучивания: https://openart.ai/workflows/t8star/foleycrafter/wZyBSeaa2lvgU3c3NlcH

Список функций
- Генерация видео в аудио: Генерирование семантически релевантных и синхронизированных звуковых эффектов на основе видеоконтента.
- Генерация звукового сигнала текстового оповещения: Генерируйте звуковые эффекты для конкретной сцены на основе текстовых подсказок.
- выравнивание времени: Убедитесь, что создаваемые звуковые эффекты синхронизированы по времени с видеоматериалом.
- Интерфейс Gradio: Предоставляет удобный интерфейс для работы с генераторами звука.
- открытый исходный код: Предоставляется полная база кода для облегчения вторичного развития и настройки разработчиками.
Использование помощи
Процесс установки
- Подготовка среды::
- Установите среду Conda:
conda env create -f requirements/environment.yaml
- Активируйте окружающую среду:
conda activate foleycrafter
- Установите Git LFS:
conda install git-lfs
а затем запуститеgit lfs install
- Установите среду Conda:
- Скачать Контрольные точки::
- быть в движении
inference.py
Автоматически загружайте контрольные точки или вручную загружайте и помещайте их вcheckpoints
Каталог.
- быть в движении
- Запуск интерфейса Gradio::
- быть в движении
python app.py --share
Запустите интерфейс Gradio.
- быть в движении
Процесс использования
- Генерация видео в аудио::
- быть в движении
python inference.py --save_dir=output/sora/
Сохраните созданный аудиофайл в указанном каталоге.
- быть в движении
- выравнивание времени::
- быть в движении
python inference.py --temporal_align --input=input/avsync --save_dir=output/avsync/
Создаваемые звуковые эффекты синхронизируются со временем видеоматериала.
- быть в движении
- Генерация звукового сигнала текстового оповещения::
- быть в движении
python inference.py --input=input/PromptControl/case1/ --seed=10201304011203481429 --prompt='noisy, people talking' --save_dir=output/PromptControl/case1_prompt/
Звуковые эффекты генерируются для определенных сцен на основе текстовых подсказок.
- быть в движении
Подробные шаги
- Подготовка среды::
- Загрузите и установите Conda: https://docs.conda.io/en/latest/miniconda.html.
- Клонируйте код проекта:
git clone https://github.com/open-mmlab/foleycrafter.git
- Перейдите в каталог проектов:
cd foleycrafter
- Выполните описанные выше шаги для установки зависимостей и настройки среды.
- Скачать Контрольные точки::
- Загрузите и разместите файл контрольной точки, убедившись, что структура каталогов выглядит следующим образом:
└── checkpoints ├── semantic │ ├── semantic_adapter.bin ├── vocoder │ ├── vocoder.pt │ ├── config.json ├── temporal_adapter.ckpt │ └── timestamp_detector.pth.tar
- Запуск интерфейса Gradio::
- быть в движении
python app.py --share
Запускает интерфейс Gradio, доступ к которому пользователь может получить через браузер.
- быть в движении
- Создавайте звуковые эффекты::
- Выберите различные режимы генерации (видео в аудио, выравнивание по времени, текстовая подсказка) и запустите соответствующие команды для создания звуковых файлов в соответствии с вашими потребностями.
Выполнив описанные выше действия, пользователи смогут легко начать работу с FoleyCrafter, чтобы добавить яркие и синхронизированные звуковые эффекты в беззвучные видеоролики для улучшения аудиовизуальных впечатлений. /n
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...