AIパーソナル・ラーニング
と実践的なガイダンス

EMO: 似顔絵画像と人の声の音声をもとに、高品質な似顔絵動画を生成。

はじめに

Yummy Portrait EMOは、AliCloudの大型モデルサービスプラットフォームであるHundred Refine (Model Studio)が提供する高品質の似顔絵ダイナミック動画生成ツールです。このツールは、似顔絵画像と人の声の音声ファイルに基づいて、リアルな似顔絵ダイナミック動画を生成します。Joyful Portrait EMOには、「Joyful Portrait EMO-detect」と「Joyful Portrait EMO」という2つの独立したモデルが含まれており、それぞれキャラクター画像のコンプライアンス検出とキャラクター動画生成に使用されます。ユーザーは簡単なAPIコールにより、仕様に準拠した高品質なキャラクターポートレート動画を素早く生成することができ、バーチャルキャスターやデジタルピープルなど、様々なアプリケーションシナリオに適しています。

Tongyiアプリで無料で体験できます。正式な商品化は、APIコールまたはAli Bailianプラットフォームでの自己展開により可能です。

おいしそうなポートレートEMO:ポートレート画像と人の声の音声に基づいて高品質のポートレート・モーション・ビデオを生成-1

 

機能一覧

  • 文字絵コンプライアンス検出EMO-detect "モデルを使用して、入力画像が仕様に適合しているかどうかを検出する。
  • キャラクタービデオ生成EMOポートレート "モデルを使用し、ポートレート画像と音声ファイルからダイナミック映像を生成します。
  • 様々なスタイルから選べる生き生きとした動き、適度な動き、落ち着いた動きなど、さまざまな動きの強さに対応。
  • APIコール開発者が統合するための使いやすいAPIインターフェイスを提供します。
  • スタンドアロン展開モデル非依存なデプロイメントをサポートし、高い同時実行性を実現します。

 

ヘルプの使用

インストールと設定

  1. オープンサービスまず、AliCloudプラットフォームでJoyful Portrait EMOサービスを開き、API Keyを取得する必要があります。
  2. APIキーの取得AliCloudアカウントにログインし、ビッグモデルサービスプラットフォームであるHundred Refineを入力し、API Keyを取得します。

使用手順

  1. 画像検出モデルの呼び出し::
    • EMO検出」モデルは、入力されたポートレート画像が仕様に適合しているかどうかを検出するために使用される。
    • APIコールの例:
     インポートリクエスト
    url = "https://api.aliyun.com/emo-detect"
    ヘッダ = {"Authorisation": "Bearer YOUR_API_KEY"}.
    data = {"image": "base64_encoded_image"}.
    response = requests.post(url, headers=headers, json=data)
    print(response.json())
    
  2. ビデオ生成モデルの呼び出し::
    • おいしそうな似顔絵EMO」モデルを使って、検出した似顔絵画像と音声ファイルを入力し、モーションビデオを生成する。
    • APIコールの例:
     インポートリクエスト
    url = "https://api.aliyun.com/emo"
    ヘッダー = {"Authorisation": "Bearer YOUR_API_KEY"}.
    データ = {
    
    
    "style_level": "active"
    }
    response = requests.post(url, headers=headers, json=data)
    print(response.json())
    

スタンドアロン展開

  1. 資源の購入AliCloudプラットフォーム上の専用インスタンスリソースを購入します。
  2. 配備モデルEMO-detect-deployment」と「EMO-deployment」モデルをそれぞれ展開する。
  3. デプロイメント・モデルを呼び出す::
    • 画像検出のために「EMO-detect-deployment」モデルを呼び出す。
    • 映像生成の「EMO展開」モデルと呼ぶ。

 

関税と河川規制

パラダイム モデル名 商品価格 フリークォータ タスク・ダウン・インターフェースQPSリミット 同時タスク数
モデルコール エモディテクト-V1 モデル・コール、後払い:


0.004元/枚

200枚

有効期間:百錬所オープンから180日間

5 無制限の同期インターフェース
エモv1 モデル・コール、後払い:

  • 1:1フレームビデオの作成:0.08ドル/秒
  • 3:4フォーマットのビデオ作成:0.16ドル/秒
1800秒

有効期間:百錬所オープンから180日間

1

(同時に、実際に実行されているのは1つのジョブのみで、キュー内の他のジョブはキューに入っている)

モデル展開 エモディテクト モデルは独立して配備され、前払いとなる:

  • 10,000ドル/計算単位・月
  • 20ドル/計算ユニット/時間

デプロイ成功後に起動する必要があり、デプロイ料金のみが請求される。

ない 5 1演算ユニットで5並列をサポート
エモ 1演算ユニットで1同時実行をサポート

 

ほら

  • 関税と河川規制具体的な料金については、AliCloudの公式ドキュメントを参照してください。
  • 同時実行数制限購入した演算ユニットによって、サポートされる同時タスク数が異なります。
AIイージー・ラーニング

AIを始めるための素人ガイド

AIツールの活用方法を、低コスト・ゼロベースから学ぶことができます。AIはオフィスソフトと同様、誰にとっても必須のスキルです。 AIをマスターすれば、就職活動で有利になり、今後の仕事や勉強の労力も半減します。

詳細を見る
無断転載を禁じます:チーフAIシェアリングサークル " EMO: 似顔絵画像と人の声の音声をもとに、高品質な似顔絵動画を生成。

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語