はじめに
Metaverse AI(オープンソース版)はGitHubでホストされているプロジェクトで、libn-netチームによって開発されている。AI技術によってデジタルな人間の画像や声をクローンし、短い動画を生成できるほか、吹き替えや字幕にも対応している。このツールは、Windowsインストーラー、ウェブ版、H5版、アプレット版があり、個人のサイドプロジェクトや小規模なチームに適している。開発者は35歳の失業中のプログラマーで、自作のショートビデオ・チームには何百万ドルも投資したが、ほとんど見返りがなかったため、友人とこのオープンソース・プロジェクトを開発することにした。現在利用可能なコア機能、ライブや機能の他の部分はまだ開発中です。
機能一覧
- イメージクローニング:写真やビデオをアップロードし、訓練することで、パーソナライズされたAIデジタル人物を生成する。
- サウンドクローン:音声を録音またはアップロードして、専用のAIサウンドを生成します。
- ビデオ生成:短いビデオをエクスポートするためのカスタマイズされたコピー、ナレーション、BGM、字幕をサポートしています。
- ショートビデオのリリース:Jittery、Shutterbug、その他のプラットフォームに直接リリースできる。
- AIダビング:スピーチのスピードとボリュームを調整し、プライベートまたはパブリックボイスをサポートします。
- AI字幕:フォント、サイズ、色をカスタマイズして字幕を自動生成。
- ライブ放送機能(開発中):リアルタイムテキストと自動アップダウン放送をサポート。
- グラフィック・コンテンツ(開発中):マーケティング記事や漫画を作成。
ヘルプの使用
MetaWorld AI(オープンソース版)は強力なツールです。使用するには、まず対応するバージョンをインストールするか、アクセスする必要があります。以下は、すぐに使い始めるための詳しい手順と説明です。
設置プロセス
MetaWorld AI(オープンソース版)にはいくつかのバージョンがありますが、ここではインストール手順を説明するための例としてWindowsインストール版をご紹介します。
- GitHubページを見る
ブラウザーを開き、https://github.com/libn-net/marketing_creator_pro_max_pc と入力すると、オープンソース版MetaWorld AIのホームページが表示されます。ページにはコードと基本的な説明があります。 - ソースコードのダウンロード
右上の緑色をクリックしてください。Code
ボタンをクリックし、"Download ZIP "を選択します。ダウンロードが完了したら、デスクトップなどのローカルフォルダに解凍してください。 - 依存環境のチェック
解凍したフォルダを開いてREADME.md
またはインストール手順を参照してください。AIツールなので、Python環境が必要な場合があります:- Pythonを持っていない場合は、https://www.python.org から最新バージョン(3.9以上を推奨)をダウンロードし、インストール時に「PATHに追加」にチェックを入れてください。
- コマンドラインを開く(WindowsユーザーはWin + Rキーを押し、次のように入力する)。
cmd
)、Unzipフォルダに移動します:cd Desktop\marketing_creator_pro_max_pc-main
- もし
requirements.txt
依存関係をインストールするには、以下のコマンドを実行する:pip install -r requirements.txt
- ランニングプログラム
スタートアップ・ファイル(例えばmain.py
)をコマンドラインに入力する:
python main.py
実行に成功すると、オペレーター・インターフェースまたはプロンプトが表示される。失敗した場合は、依存関係が完了しているか確認してください。
- 他のバージョンのインストール
- ウェブ版ローカルにインストールせずに、プロジェクトが提供するリンク(もしあれば)にアクセスする。
- H5/スモールアプリ版https://github.com/libn-net/marketing_creator_pro_max_uni、指示に従ってダウンロードし、実行してください。
- バックエンドAPIカスタム開発については、https://github.com/libn-net/marketing_creator_pro_max_backend。
主な機能
MetaWorld AI(オープンソース版)のコア機能の使い方をご紹介します。
1.イメージクローニング
- 手続き::
プログラムを起動した後、"イメージクローニング "モジュールに入る。アップロード」をクリックし、顔の鮮明な写真またはビデオを選択します。Train "をクリックし、数分待つとAIデジタル人体画像が生成されます。完成したら、「リスト」で見ることができる。 - ポイント::
写真は正面向きで遮るものがないものである必要があり、トレーニング時間はコンピューターの性能に左右されるが、通常は数分から30分程度である。
2.サウンドクローニング
- 手続き::
サウンドクローン "モジュールを開きます。Record "をクリックして1-3分のオーディオを録音するか、既存のオーディオファイルをアップロードします。Train "をクリックして、サウンドクローンを生成します。終了したら、"List "から選択します。 - ポイント::
録音はバックグラウンドノイズがなく、MP3またはWAVフォーマットに対応していること。
3.ビデオ生成
- 手続き::
ビデオ・ジェネレーション」モジュールに進む: - コピーライターGenerate Copy "をクリックし、キーワード(例えば "new product release")またはJitterbugリンクを入力し、"Imitation "をクリックするとテキストが生成されます。
- さくちゅうじんぶつプライベートAIデジタルパーソン」または「パブリックAIデジタルパーソン」から画像を選択します。
- アフレコクローン音声を選択し、音声のスピードとボリュームを調整し、ナレーションを生成します。
- バックグラウンドミュージック(BGM)音声をアップロードするか、公開されている素材を使用し、音量を調整してください。
- キャプション字幕生成」をオンにし、フォント、サイズ、色を選択します。
- 導く解像度(例:1080p)とフォーマット(例:MP4)を設定し、"Generate Video "をクリックします。
- ポイント::
コピーは手動で修正できます。書き出す前にプレビューして効果を確認できます。
4.ショートビデオのリリース
- 手続き::
動画を作成したら、"Publish "をクリックし、プラットフォーム(例:Shutterstock)を選択します。アカウント情報を入力し、アップロードして公開します。 - ポイント::
事前にプラットフォームアカウントにログインする必要があり、認証コードが必要になる場合があります。
ほら
- ライブストリーミングとグラフィック機能は開発レベルが低く(20%と10%)、現時点では使用できません。
- オープンソースのプロジェクトにはバグがある可能性があり、GitHubの "Issues "ページで問題を報告することができます。
- 開発者は、退役軍人、失業者、母親からの質問に優先的に答えている。
アプリケーションシナリオ
- 個人的な副業 ショートビデオ制作
ユーザーは自分の画像や声をクローンして商品プロモーションビデオを作成し、Jitterbugに投稿してトラフィック収入を得る。 - 中小企業マーケティング
ショップオーナーはYuanworld AIを使って広告ビデオを作成し、商品の特徴を紹介してオンライン顧客を引き付ける。 - 教育コンテンツ制作
教師はこのツールを使って画像を複製し、短い指導ビデオを作成し、ビデオ番号に投稿して授業を共有する。
品質保証
- MetaWorld AIは無料ですか?
はい、オープンソース版は完全に無料で、ユーザーは自分の使用や修正のためにコードをダウンロードすることができます。 - プログラミングの知識が必要ですか?
必ずしもそうではない。インストールやコードの調整が必要な場合は、プログラミングの知識があったほうがいい。 - 中国のコンテンツに対応していますか?
サポートインターフェースと生成されたコンテンツは中国語で提供され、中国のユーザーに最適です。