EMO: 似顔絵画像と人の声の音声をもとに、高品質な似顔絵動画を生成。

52.4K 00

はじめに

Yummy Portrait EMOは、AliCloudの大型モデルサービスプラットフォームであるHundred Refine (Model Studio)が提供する高品質の似顔絵ダイナミック動画生成ツールです。このツールは、似顔絵画像と人の声の音声ファイルに基づいて、リアルな似顔絵ダイナミック動画を生成します。Joyful Portrait EMOには、「Joyful Portrait EMO-detect」と「Joyful Portrait EMO」という2つの独立したモデルが含まれており、それぞれキャラクター画像のコンプライアンス検出とキャラクター動画生成に使用されます。ユーザーは簡単なAPIコールにより、仕様に準拠した高品質なキャラクターポートレート動画を素早く生成することができ、バーチャルキャスターやデジタルピープルなど、様々なアプリケーションシナリオに適しています。

Tongyiアプリで無料で体験できます。正式な商品化は、APIコールまたはAli Bailianプラットフォームでの自己展開により可能です。

機能一覧

文字絵コンプライアンス検出EMO-detect "モデルを使用して、入力画像が仕様に適合しているかどうかを検出する。
キャラクタービデオ生成EMOポートレート "モデルを使用し、ポートレート画像と音声ファイルからダイナミック映像を生成します。
様々なスタイルから選べる生き生きとした動き、適度な動き、落ち着いた動きなど、さまざまな動きの強さに対応。
APIコール開発者が統合するための使いやすいAPIインターフェイスを提供します。
スタンドアロン展開モデル非依存なデプロイメントをサポートし、高い同時実行性を実現します。

ヘルプの使用

インストールと設定

オープンサービスまず、AliCloudプラットフォームでJoyful Portrait EMOサービスを開き、API Keyを取得する必要があります。
APIキーの取得AliCloudアカウントにログインし、ビッグモデルサービスプラットフォームであるHundred Refineを入力し、API Keyを取得します。

使用手順

画像検出モデルの呼び出し::

EMO検出」モデルは、入力されたポートレート画像が仕様に適合しているかどうかを検出するために使用される。
APIコールの例：

 import requests
url = "https://api.aliyun.com/emo-detect"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
data = {"image": "base64_encoded_image"}
response = requests.post(url, headers=headers, json=data)
print(response.json())

ビデオ生成モデルの呼び出し::

おいしそうな似顔絵EMO」モデルを使って、検出した似顔絵画像と音声ファイルを入力し、モーションビデオを生成する。
APIコールの例：

 import requests
url = "https://api.aliyun.com/emo"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
data = {
"image": "base64_encoded_image",
"audio": "base64_encoded_audio",
"style_level": "active"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())

スタンドアロン展開

資源の購入AliCloudプラットフォーム上の専用インスタンスリソースを購入します。
配備モデルEMO-detect-deployment」と「EMO-deployment」モデルをそれぞれ展開する。
デプロイメント・モデルを呼び出す::
- 画像検出のために「EMO-detect-deployment」モデルを呼び出す。
- 映像生成の「EMO展開」モデルと呼ぶ。

関税と河川規制

パラダイム	モデル名	商品価格	フリークォータ	タスク・ダウン・インターフェースQPSリミット	同時タスク数
モデルコール	エモディテクト-V1	モデル・コール、後払い： 0.004元/枚	200枚有効期間：百錬所オープンから180日間	5	無制限の同期インターフェース
モデルコール	エモv1	モデル・コール、後払い： 1:1フレームビデオの作成：0.08ドル/秒 3:4フォーマットのビデオ作成：0.16ドル/秒	1800秒有効期間：百錬所オープンから180日間	5	1 (同時に、実際に実行されているのは1つのジョブのみで、キュー内の他のジョブはキューに入っている)
モデル展開	エモディテクト	モデルは独立して配備され、前払いとなる： 10,000ドル／計算単位・月 20ドル／計算ユニット／時間デプロイ成功後に起動する必要があり、デプロイ料金のみが請求される。	ない	5	1演算ユニットで5並列をサポート
モデル展開	エモ		ない	5	1演算ユニットで1同時実行をサポート