メタバースAI：AIデジタル人クローンとショートビデオ生成ツールのオープンソース版

57.7K 00

はじめに

Metaverse AI（オープンソース版）はGitHubでホストされているプロジェクトで、libn-netチームによって開発されている。AI技術によってデジタルな人間の画像や声をクローンし、短い動画を生成できるほか、吹き替えや字幕にも対応している。このツールは、Windowsインストーラー、ウェブ版、H5版、アプレット版があり、個人のサイドプロジェクトや小規模なチームに適している。開発者は35歳の失業中のプログラマーで、自作のショートビデオ・チームには何百万ドルも投資したが、ほとんど見返りがなかったため、友人とこのオープンソース・プロジェクトを開発することにした。現在利用可能なコア機能、ライブや機能の他の部分はまだ開発中です。

機能一覧

イメージクローニング：写真やビデオをアップロードし、訓練することで、パーソナライズされたAIデジタル人物を生成する。
サウンドクローン：音声を録音またはアップロードして、専用のAIサウンドを生成します。
ビデオ生成：短いビデオをエクスポートするためのカスタマイズされたコピー、ナレーション、BGM、字幕をサポートしています。
ショートビデオのリリース：Jittery、Shutterbug、その他のプラットフォームに直接リリースできる。
AIダビング：スピーチのスピードとボリュームを調整し、プライベートまたはパブリックボイスをサポートします。
AI字幕：フォント、サイズ、色をカスタマイズして字幕を自動生成。
ライブ放送機能（開発中）：リアルタイムテキストと自動アップダウン放送をサポート。
グラフィック・コンテンツ（開発中）：マーケティング記事や漫画を作成。

ヘルプの使用

MetaWorld AI（オープンソース版）は強力なツールです。使用するには、まず対応するバージョンをインストールするか、アクセスする必要があります。以下は、すぐに使い始めるための詳しい手順と説明です。

設置プロセス

MetaWorld AI（オープンソース版）にはいくつかのバージョンがありますが、ここではインストール手順を説明するための例としてWindowsインストール版をご紹介します。

GitHubページを見る
ブラウザーを開き、https://github.com/libn-net/marketing_creator_pro_max_pc と入力すると、オープンソース版MetaWorld AIのホームページが表示されます。ページにはコードと基本的な説明があります。
ソースコードのダウンロード
右上の緑色をクリックしてください。 Code ボタンをクリックし、"Download ZIP "を選択します。ダウンロードが完了したら、デスクトップなどのローカルフォルダに解凍してください。
依存環境のチェック
解凍したフォルダを開いて README.md またはインストール手順を参照してください。AIツールなので、Python環境が必要な場合があります：
- Pythonを持っていない場合は、https://www.python.org から最新バージョン（3.9以上を推奨）をダウンロードし、インストール時に「PATHに追加」にチェックを入れてください。
- コマンドラインを開く（WindowsユーザーはWin + Rキーを押し、次のように入力する）。 cmd)、Unzipフォルダに移動します：
```
cd Desktop\marketing_creator_pro_max_pc-main
```
- もし requirements.txt依存関係をインストールするには、以下のコマンドを実行する：
```
pip install -r requirements.txt
```
ランニングプログラム
スタートアップ・ファイル（例えば main.py)をコマンドラインに入力する：

python main.py

実行に成功すると、オペレーター・インターフェースまたはプロンプトが表示される。失敗した場合は、依存関係が完了しているか確認してください。

他のバージョンのインストール

ウェブ版ローカルにインストールせずに、プロジェクトが提供するリンク（もしあれば）にアクセスする。
H5/スモールアプリ版https://github.com/libn-net/marketing_creator_pro_max_uni、指示に従ってダウンロードし、実行してください。
バックエンドAPIカスタム開発については、https://github.com/libn-net/marketing_creator_pro_max_backend。

主な機能

MetaWorld AI（オープンソース版）のコア機能の使い方をご紹介します。

1.イメージクローニング

手続き::
プログラムを起動した後、"イメージクローニング "モジュールに入る。アップロード」をクリックし、顔の鮮明な写真またはビデオを選択します。Train "をクリックし、数分待つとAIデジタル人体画像が生成されます。完成したら、「リスト」で見ることができる。
ポイント::
写真は正面向きで遮るものがないものである必要があり、トレーニング時間はコンピューターの性能に左右されるが、通常は数分から30分程度である。

2.サウンドクローニング

手続き::
サウンドクローン "モジュールを開きます。Record "をクリックして1-3分のオーディオを録音するか、既存のオーディオファイルをアップロードします。Train "をクリックして、サウンドクローンを生成します。終了したら、"List "から選択します。
ポイント::
録音はバックグラウンドノイズがなく、MP3またはWAVフォーマットに対応していること。

3.ビデオ生成

手続き::
ビデオ・ジェネレーション」モジュールに進む：
コピーライターGenerate Copy "をクリックし、キーワード（例えば "new product release"）またはJitterbugリンクを入力し、"Imitation "をクリックするとテキストが生成されます。
さくちゅうじんぶつプライベートAIデジタルパーソン」または「パブリックAIデジタルパーソン」から画像を選択します。
アフレコクローン音声を選択し、音声のスピードとボリュームを調整し、ナレーションを生成します。
バックグラウンドミュージック（BGM）音声をアップロードするか、公開されている素材を使用し、音量を調整してください。
キャプション字幕生成」をオンにし、フォント、サイズ、色を選択します。
導く解像度（例：1080p）とフォーマット（例：MP4）を設定し、"Generate Video "をクリックします。
ポイント::
コピーは手動で修正できます。書き出す前にプレビューして効果を確認できます。

4.ショートビデオのリリース

手続き::
動画を作成したら、"Publish "をクリックし、プラットフォーム（例：Shutterstock）を選択します。アカウント情報を入力し、アップロードして公開します。
ポイント::
事前にプラットフォームアカウントにログインする必要があり、認証コードが必要になる場合があります。

ほら

ライブストリーミングとグラフィック機能は開発レベルが低く（20%と10%）、現時点では使用できません。
オープンソースのプロジェクトにはバグがある可能性があり、GitHubの "Issues "ページで問題を報告することができます。
開発者は、退役軍人、失業者、母親からの質問に優先的に答えている。

アプリケーションシナリオ

個人的な副業ショートビデオ制作
ユーザーは自分の画像や声をクローンして商品プロモーションビデオを作成し、Jitterbugに投稿してトラフィック収入を得る。
中小企業マーケティング
ショップオーナーはYuanworld AIを使って広告ビデオを作成し、商品の特徴を紹介してオンライン顧客を引き付ける。
教育コンテンツ制作
教師はこのツールを使って画像を複製し、短い指導ビデオを作成し、ビデオ番号に投稿して授業を共有する。

品質保証

MetaWorld AIは無料ですか？
はい、オープンソース版は完全に無料で、ユーザーは自分の使用や修正のためにコードをダウンロードすることができます。
プログラミングの知識が必要ですか？
必ずしもそうではない。インストールやコードの調整が必要な場合は、プログラミングの知識があったほうがいい。
中国のコンテンツに対応していますか？
サポートインターフェースと生成されたコンテンツは中国語で提供され、中国のユーザーに最適です。