AI个人学习
和实操指南

FoleyCrafter:为无声视频添加生动同步的音效

综合介绍

FoleyCrafter 是一个由 OpenMMLab 开发的开源项目,旨在为无声视频生成生动且同步的音效。该项目利用先进的人工智能技术,通过分析视频内容,生成与之语义相关且时间同步的音效,从而增强视频的真实感和情感深度。FoleyCrafter 的目标是为电影、游戏等领域提供高质量的音效解决方案,提升观众的视听体验。

自动合成配音工作流:https://openart.ai/workflows/t8star/foleycrafter/wZyBSeaa2lvgU3c3NlcH


FoleyCrafter:为无声视频添加生动同步的音效-1

 

功能列表

  • 视频到音频生成:根据视频内容生成语义相关且同步的音效。
  • 文本提示音效生成:通过文本提示生成特定场景的音效。
  • 时间对齐:确保生成的音效与视频内容时间同步。
  • Gradio 界面:提供用户友好的界面,方便用户进行音效生成操作。
  • 开源代码:提供完整的代码库,方便开发者进行二次开发和定制。

 

使用帮助

安装流程

  1. 准备环境
    • 安装 Conda 环境:conda env create -f requirements/environment.yaml
    • 激活环境:conda activate foleycrafter
    • 安装 Git LFS:conda install git-lfs,然后运行 git lfs install
  2. 下载检查点
    • 运行 inference.py 自动下载检查点,或手动下载并放置在 checkpoints 目录下。
  3. 启动 Gradio 界面
    • 运行 python app.py --share 启动 Gradio 界面。

使用流程

  1. 视频到音频生成
    • 运行 python inference.py --save_dir=output/sora/,将生成的音频文件保存在指定目录。
  2. 时间对齐
    • 运行 python inference.py --temporal_align --input=input/avsync --save_dir=output/avsync/,确保生成的音效与视频内容时间同步。
  3. 文本提示音效生成
    • 运行 python inference.py --input=input/PromptControl/case1/ --seed=10201304011203481429 --prompt='noisy, people talking' --save_dir=output/PromptControl/case1_prompt/,根据文本提示生成特定场景的音效。

详细操作步骤

  1. 准备环境
    • 下载并安装 Conda:https://docs.conda.io/en/latest/miniconda.html
    • 克隆项目代码:git clone https://github.com/open-mmlab/foleycrafter.git
    • 进入项目目录:cd foleycrafter
    • 按照上述步骤安装依赖并配置环境。
  2. 下载检查点
    • 下载并放置检查点文件,确保目录结构如下:
     └── checkpoints
    ├── semantic
    │   ├── semantic_adapter.bin
    ├── vocoder
    │   ├── vocoder.pt
    │   ├── config.json
    ├── temporal_adapter.ckpt
    │   └── timestamp_detector.pth.tar
    
  3. 启动 Gradio 界面
    • 运行 python app.py --share 启动 Gradio 界面,用户可以通过浏览器访问界面进行操作。
  4. 生成音效
    • 根据需要选择不同的生成模式(视频到音频、时间对齐、文本提示),运行相应的命令生成音效文件。

通过以上步骤,用户可以轻松上手使用 FoleyCrafter,为无声视频添加生动且同步的音效,提升视频的视听体验。 /n

AI轻松学

普通人的AI入门指南

帮助你以低成本、零基础学会如何利用AI工具。AI就像办公软件一样,是每个人的必备技能。 掌握AI会让你在求职中占据优势,在未来的工作和学习中事半功倍。

查看详情>
未经允许不得转载:首席AI分享圈 » FoleyCrafter:为无声视频添加生动同步的音效

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文