AIパーソナル・ラーニング
と実践的なガイダンス

FoleyCrafter: 無音ビデオに鮮やかな同期サウンドを追加する

はじめに

FoleyCrafterは、OpenMMLabによって開発されたオープンソースプロジェクトで、無音ビデオのための鮮明で同期された効果音を生成します。FoleyCrafterのゴールは、映画、ゲーム、その他の分野に高品質のサウンドソリューションを提供し、観客のオーディオビジュアル体験を向上させることです。

ナレーションワークフローの自動合成: https://openart.ai/workflows/t8star/foleycrafter/wZyBSeaa2lvgU3c3NlcH


FoleyCrafter: 無音ビデオに鮮やかな同期サウンドを追加する-1

 

機能一覧

  • ビデオからオーディオへビデオコンテンツに基づいて、意味的に関連性のある同期された効果音を生成します。
  • テキストアラート音生成テキストキューからシーン固有のサウンドエフェクトを生成します。
  • タイムアライメント生成されるサウンドエフェクトがビデオコンテンツと時間的に同期していることを確認してください。
  • グラディオ・インターフェイス音作りのためのユーザーフレンドリーなインターフェースを提供します。
  • オープンソース開発者による二次開発やカスタマイズを容易にするために、完全なコードベースが提供されています。

 

ヘルプの使用

設置プロセス

  1. 環境を整える::
    • Conda環境をインストールする:conda env create -f requirements/environment.yaml
    • 環境を活性化させる:コンダ活性化フォーリークラフター
    • Git LFSをインストールします:conda install git-lfsを実行する。 git lfs install
  2. ダウンロード Checkpoints::
    • うごきだす 推論.py チェックポイントを自動的にダウンロードするか、手動でダウンロードして チェックポイント カタログ
  3. Gradioインターフェースの起動::
    • うごきだす python app.py --share Gradioインターフェイスを起動します。

使用プロセス

  1. ビデオからオーディオへ::
    • うごきだす python inference.py --save_dir=output/sora/生成されたオーディオファイルを指定されたディレクトリに保存します。
  2. タイムアライメント::
    • うごきだす python inference.py --temporal_align --input=input/avsync --save_dir=output/avsync/生成される効果音は、ビデオコンテンツの時間と同期している。
  3. テキストアラート音生成::
    • うごきだす python inference.py --input=input/PromptControl/case1/ --seed=10201304011203481429 --prompt='noisy, people talking' --save_dir=output/PromptControl/case1_prompt/効果音は、テキストを手掛かりに特定のシーンに合わせて生成される。

詳細な手順

  1. 環境を整える::
    • Condaのダウンロードとインストール: https://docs.conda.io/en/latest/miniconda.html
    • プロジェクトコードをクローンする:git clone https://github.com/open-mmlab/foleycrafter.git
    • プロジェクト・カタログにアクセスする:CDフォーリークラフター
    • 上記の手順に従って、依存関係をインストールし、環境を設定する。
  2. ダウンロード Checkpoints::
    • チェックポイント・ファイルをダウンロードして置き、ディレクトリ構造が以下のようになっていることを確認する:
     チェックポイント
    セマンティック
    ├── semantic_adapter.bin
    ボコーダー
    │ ├── vocoder.pt
    ├── config.json
    ├── temporal_adapter.ckpt
    │ └── timestamp_detector.pth.tar
    
  3. Gradioインターフェースの起動::
    • うごきだす python app.py --share ブラウザーからアクセスできるGradioインターフェイスを起動する。
  4. 効果音の生成::
    • 必要に応じてさまざまな生成モード(ビデオからオーディオ、タイムアライメント、テキストキュー)を選択し、対応するコマンドを実行してサウンドファイルを生成する。

以上の手順で、ユーザーは簡単にFoleyCrafterを使い始めることができ、無音ビデオに鮮やかで同期したサウンドエフェクトを追加して、オーディオビジュアル体験を向上させることができます。 /n

AIイージー・ラーニング

AIを始めるための素人ガイド

AIツールの活用方法を、低コスト・ゼロベースから学ぶことができます。AIはオフィスソフトと同様、誰にとっても必須のスキルです。 AIをマスターすれば、就職活動で有利になり、今後の仕事や勉強の労力も半減します。

詳細を見る
無断転載を禁じます:チーフAIシェアリングサークル " FoleyCrafter: 無音ビデオに鮮やかな同期サウンドを追加する

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語