はじめに
Tavusは人間とAIとのインタラクションに特化した開発者向けプラットフォームで、開発者が視覚、音声、感情知能を備えたAIエージェントを構築できる使いやすいAPIを提供している。その中核製品であるConversational Video Interface (CVI)は、人間の脳の認知アーキテクチャを模倣し、自然な対話、環境認識、リアルタイム応答をサポートする。また、Tavusのテクノロジーは、非常にリアルなデジタル・ドッペルゲンガーを生成し、企業が人間とコンピュータの対話に「人間味」を取り戻すのを支援する。Tavus社の技術は、非常にリアルなデジタル・ドッペルゲンガーを生成し、人材採用、顧客サービス、製品開発など幅広い用途で、企業が人間とコンピュータの対話に「人間味」を取り戻すのを支援する。サンフランシスコに本社を置く同社は、大小を問わず開発者や企業に愛されており、ユーザーのプライバシーとセキュリティを守りつつ、モジュール化されたAPIとホワイトラベルによってAIビデオ開発を簡素化することに尽力している。
機能一覧
- 会話型ビデオインターフェース(CVI)意味、トーン、ムードを理解するために、AIがユーザーとリアルタイムで自然なビデオ対話を行うことをサポートします。
- デジタル・ドッペルゲンガー世代Phoenix-3のモデルを使って、自然な表情と微小な動きを持つリアルなデジタル・ドッペルゲンガーを作成します。
- 音声リズムの知識Sparrow-0モデルは、人間化されたポーズ&レスポンスのための対話ペーシングを分析します。
- 視覚環境の理解Raven-0モデルは、AIに視覚情報と感情を知覚し読み取る能力を与える。
- テキストからビデオへテキストを入力すると、デジタルスプリットビデオが生成されます。
- ホワイトレーベル・サポートTavusブランドフリーのAPIを提供し、サードパーティのアプリケーションに簡単に統合できます。
- セキュリティ機構内蔵のユーザー認証とSOC 2コンプライアンスにより、プライバシーとデータセキュリティを確保します。
- モジュラー・インテグレーション既存製品への迅速な組み込みをサポートする柔軟な開発者ツールを提供します。
ヘルプの使用
Tavusは開発者向けのAIビデオ・プラットフォームで、公式サイトに登録しAPIを使用することで、会話型ビデオ・インターフェースやデジタル・ドッペルゲンガーを素早く構築することができる。以下は、ユーザーがゼロから始めるための詳細なガイドである。
APIの登録と取得
- 公式ウェブサイトを見るブラウザを開き
https://www.tavus.io/
ご不明な点がございましたら、お気軽にタバスホームページまでお問い合わせください。 - アカウントの作成登録するには、"Get Started "ボタンをクリックし、Eメールアドレスとパスワードを入力してください。
- パッケージを選択Tavusは無料トライアルと有料プラン(Starter、Growth、Enterpriseなど)を提供しています。
- 無料トライアルは初体験に適しており、基本的な機能と少量の生成時間が含まれる。
- 有料プランの料金ページを表示するにはログインが必要です。
billing@tavus.io
企業向けにカスタマイズされたソリューションをご利用ください。
- APIキーの取得ログイン後、デベロッパーセンター(
https://platform.tavus.io/
)、"API Keys "ページでキーを生成する。
デジタル・ドッペルゲンガーを作る
タバスのPhoenix-3モデルは、非常にリアルなデジタル・ドッペルゲンガーを生成する:
- トレーニングビデオの録画::
- 2~15分のビデオを用意し、普通の機器を使って正面の映像を録画するだけでいい。
- 公式サイトに掲載されている台本を声に出して読み、声が明瞭で自然であることを確認する。
- 開発者ポータルにログインし、「Replica」モジュールで動画をアップロードします。
- ドッペルゲンガーの生成::
- Create Replica "をクリックすると、Phoenix-3モデルがビデオを処理し、デジタルスプリットを生成します。
- 処理時間は通常1~2時間で、処理終了後に結果をプレビューすることができる。
- 安全認証::
- 分身を作成できるのは本人だけであることを確認するため、システムは同意スクリプトの読み上げを求める。
- 分割した背景や表情を調整し、保存して使うことができる。
会話ビデオインターフェース(CVI)の使用
CVIはTavusのコア機能で、リアルタイムのビデオ対話をサポートします:
- ダイアログ・インスタンスの作成::
- 開発者ポータルで "Conversational Video "を選択し、ダイアログのパラメータ(時間や背景など)を設定します。
- Generate(生成)」をクリックして、ダイアログ・インスタンスのURLまたはIDを取得する。
- APIによる統合::
- 例えば、APIキーを使ってCVIを呼び出します:
curl -X POST "https://api.tavus.io/v1/conversation" ୧-͈ᴗ-͈ -H "Authorization: Bearer YOUR_API_KEY" ୧ '{"replica_id: "YOUR_REPLICA_ID": "YOUR_REPLICA_ID". -d '{"replica_id": "YOUR_REPLICA_ID", "duration": 300}'.
- 返されたURLは、ウェブページやアプリケーションに埋め込むことができる。
- 例えば、APIキーを使ってCVIを呼び出します:
- エクスペリエンス・インタラクション::
- ユーザーがURLからダイアログを入力すると、AIはSparrow-0(発話リズム)とRaven-0(視覚認識)で自然に応答する。
- レイテンシーは1秒未満で、リアルタイムのカスタマーサービスや面接のシナリオに適している。
ビデオにテキストを生成する
- 入力スクリプト::
- 開発者ポータルの「Video Generation」ページで、テキストスクリプトを入力します(例:「Welcome to our product」)。
- バッチ生成のために、名前や会社名などの変数置換をサポート。
- APIの呼び出し::
- サンプルコード:
curl -X POST "https://api.tavus.io/v1/video" \ -H "Authorization: Bearer YOUR_API_KEY" -d '{"script": "Hello, [name], this is your exclusive video", "replica_id": "YOUR_REPLICA_ID"}'.
- 生成されたビデオリンクは、ダウンロードすることも、直接使用することもできる。
- サンプルコード:
- カスタマイズ・オプション::
- 背景やボタン(「さらに詳しく」など)を追加したり、スプリットアクションを調整したりすることができます。
デベロッパーの統合とホワイトラベル
- ドキュメントを見るアクセス
https://docs.tavus.io/
APIの詳細については、APIの完全な説明とサンプルコードを入手してください。 - 組み込みアプリケーション::
- 提供されるSDKまたはREST APIを使用して、CVIまたはデジタルスプリットを製品に組み込みます。
- ホワイトラベルモードでは、Tavusブランドの痕跡を残さず、アプリケーションの一貫性を保つことができます。
- テストと最適化::
- サンドボックス環境でAPIをテストし、機能が正しく動作することを確認する。
- デベロッパーポータルで使用状況やログを確認し、パフォーマンスを最適化。
セキュリティとプライバシー
- 認証分身を作成するたびに、他人になりすまされないように音声認証をパスする必要があります。
- コンプライアンスTavusはSOC 2に準拠しており、データは暗号化されて保存され、ユーザーはいつでも変更内容を削除することができます。
- コンテンツ監査不適切なコンテンツや幻覚(hallucination)を発生させないための自動チェック機能が組み込まれています。
ほら
- 請求ルール詳しくは開発者ポータルをご覧ください。
- テクニカルサポートご不明な点がございましたら、メールにてお問い合わせください。
support@tavus.io
またはFAQ (https://docs.tavus.io/
). - 更新情報オフィシャル・ブログをフォローする。
https://www.tavus.io/post/
)、Sparrow-0、Raven-0などのモデルの最新の進歩について学ぶことができる。
TavusのAPIはシンプルで直感的に使えるように設計されており、開発者はわずか2、3日で統合を完了できる。