はじめに
MiniMax Audioは、MiniMax社のAI音声生成ツールで、テキストを類似性の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルをベースにしており、音声合成の類似度は最大99%、スタジオグレードの音質、30以上の言語と複数のアクセントをサポートしています。ユーザーはテキストを入力したり、ファイルやリンクをアップロードして簡単に音声を生成することができ、オーディオブックやポッドキャストなどのコンテンツ制作に適しています。
国内版(hailuoai.com)と海外版(minimax.io)の機能は似ているが、海外版の方が非常に長いテキスト処理(最大20万文字)に重点を置いており、柔軟なサブスクリプションプランも用意されている。毎日4,000クレジット(約5分間の音声生成)のボーナスが付く有料版は、商用利用やより多くの機能をサポートし、使いやすいため、クリエイターや開発者に人気がある。
国内版は現在、使用制限なしの期間限定無料。
-
コンク・ヴォイス(国内版)
-
ミニマックス・オーディオ(海外版)
機能一覧
- 音声合成テキストを入力し、自然な音声を素早く生成します。
- ボイスクローニング10秒間の音声をアップロードして、類似性の高い音を再現してください。
- 超長文テキスト処理国際版は一度に200,000文字をサポートするが、国内版は5,000文字または10,000文字に制限される。
- ドキュメントとリンクのサポートファイルをアップロードするか、URLを入力してテキストを抽出し、音声を生成します。
- 感情コントロール(有料版はより多くのオプションに対応しています。) : 幸せ、穏やかなどの声の感情を調整します。
- 多言語対応30以上の言語に対応していますが、無料版では16言語に制限されています。
- 歴史管理生成されたレコードの表示、削除、整理。
- APIの統合他のアプリケーションを組み込むための開発者インタフェースを提供します。
ヘルプの使用
MiniMax Audioはインストール不要で、ウェブから直接操作できます。国内版と海外版は基本的に同じで、ここに詳細なガイドがあります。
始め方
- 国内版はhttps://hailuoai.com/audio、海外版はhttps://www.minimax.io/audio。
- ログイン」をクリックして登録するか、Eメールアドレスでログインしてください。
- ログイン後、テキスト入力ボックスと機能オプションがあるメイン画面に入ります。
音声生成の基本操作
- 入力テキストボックスに "Welcome to MiniMax Audio "などと入力してください。
- 言語とトーンの選択: 言語(例:「中国語」)とトーン(例:「男声-低」)を選択します。
- オーディオの生成Generate "をクリックし、数秒後にMP3ファイルを聴くかダウンロードする。
- 消費量を見る海外版ではクレジットを表示(英語1文字=1ポイント、中国語1文字=2ポイント)しており、国内版と統一している。
ファイルやリンクの使用
- ファイルのアップロードファイルをアップロード」をクリックし、TXT、PDFなどをサポートし、自動的にテキストを抽出します。
- リンクを入力ウェブページのURLを貼り付け、"Load "をクリックするとコンテンツが表示されます。
- 生成プロセステキストを確認し、"Generate "をクリックすると音声がダウンロードされます。
ボイスクローン機能
- サンプルの準備10秒以上のクリアな音声を録音し、MP3またはWAVとして保存できます。
- アップロードと作成Voice Clone "オプションでアップロードし、"Create Voice "をクリックします。
- アプリケーション・クローニング新しい音色を選択し、テキストを入力して音声を生成します。
- 制限の内容無料版は3クローン、スターター版は10クローン、スタンダード版は100クローンに制限されています。
テキストの長さとクレジット
- 国際版一度に20万文字、長文の非同期処理。
- 国内版HDモードは5,000文字まで、ターボモードは10,000文字まで。
- 海外版クレジット無料版は1日4,000ポイント(約5分の音声)、スターター版は1ヶ月100,000ポイント(約2時間)、スタンダード版は1,000,000ポイント(約20時間)。
購読とトップアップ(国際版)
- 無料版毎月約2.5時間、16言語に限定。
- スターター・エディション月額5ドル、約4.5時間、高速生成、商用利用可。
- スタンダード・エディション約22.5時間で月額30ドル、クローン作成の上限は高め。
- リチャージ100万ポイントにつき30ドル、最低5ドル。
APIの使用
- キーを入手するログイン後、https://www.minimax.io/platform/document/T2AV2 または国内APIページよりお申し込みください。
<API Key>
. - 呼び出しの例::
curl -X POST https://api.minimax.io/audio \
-H "Authorization: Bearer <API Key>" \
-H "Content-Type: application/json" \
-d '{"text": "你好,这是测试", "language": "zh", "voice": "female_gentle"}'
- ファイルアドレス海外版は上記リンク先、国内版はhttps://hailuoai.com/api。
使用方法
- 国際版商用利用にはStarterまたはStandardサブスクリプションが必要です。
- 最適化の提案オーディオの音質が悪い場合、音色やセグメントの生成を調整します。
操作は簡単で、数分で始めることができ、あらゆるニーズに適しています。
アプリケーションシナリオ
- オーディオブック制作
長いテキストを音声に変換してオーディオブックを作成し、共有したり出版したりできます。 - ポッドキャスト制作
スクリプトを入力してポッドキャストをすばやく生成し、録音時間を短縮。 - 教材
コース教材を音声に変換し、聴きやすくしたり、視覚障害者の学習を支援します。 - ゲーム・ダビング
ボイスクローニングを使用して、キャラクター用のユニークなボイスを作成し、体験を向上させましょう。
品質保証
- 国内版と海外版の違いは何ですか?
海外版は20万文字の超長文をサポートしているが、国内版は5000文字または1万文字に制限されているが、期間限定で無料。 - 国際無料版の有効期間は?
1日4,000ボーナスポイント、約5分のオーディオ、月2.5時間まで。 - 対応言語は?
30種以上、無料版は中国語、英語など16種まで。 - ボイスクローニングに必要な音声の長さは?
最低10秒のクリアな音声。 - 市販されていますか?
海外版にはStarterまたはStandardのサブスクリプションが必要で、国内版には明確な制限はない。