優れたボイスオーバー製品の生産の内容のための国内生産が行われていない、いずれかのAPIを使用することができますだけまたは製品は大丈夫ですサウンドモデルが動作しません。
例えば、海外では イレブンラボ 英語はまあまあだが、中国語は本当に引っ張っているが、オープンソースのモデルの主な問題は、モデルの品質が比較的悪いことで、特に音質が悪く、現在の明確な感覚、多言語混合のシーンや多音多義語の表現が不正確などである。
ミニマックスは1カ月前に稼働した。 コンクAI国際版、オンライン第二声クローン機能、中国語と英語は非常によく音読!数日前に音声生成機能が国内ページで公開されたのですが、試してみて本当に驚きました。17以上の言語をサポートし、様々な感情表現を正確にコントロールし、様々なニーズを満たすために数百のサウンドライブラリをサポートしています。.
最も重要なのは、音質が本当に高いことで、サウンド生成にありがちな問題はまったくなく、同じトーンが使われているにもかかわらず、微調整によって異なるサウンドになる、高度にカスタマイズ可能なオプションがある。
私が作ったこの小さな作品を見てみよう。それから、機能面でも効果面でも、コンチのスピーチ生成機能の効果を見てみよう。
詳細な機能カスタマイズオプション
コンチボイスの特徴を見てみましょう。コンチボイスは実にパワフルで詳細で、17以上の言語をサポートする巨大なサウンドライブラリを持っています。各言語は幅広い音色に対応し、男性・女性の声や年齢も自由に選択できる。.
例えば、私たちのビデオスクリプトには正義感のある老人が必要だが、このフィルターを通せばすぐにアクセスできる。
また、音色を選択した後に、細かくカスタマイズすることも可能だ。
まず、トーンの感情をカスタマイズすることができます。嬉しい、悲しい、怒っているなど、5〜6種類の感情、例えば、次のオーディオは、私は暖かいガールフレンドのトーンの異なる感情のパフォーマンスを示し、あなたはそれをはっきりと聞くことができ、非常に自然。
次に話すスピードだが、これは彼が話すスピードの値が高いほど理解しやすく、音量もまた理解しやすく、高い声の値が高いほど理解しやすく、このトーンは大雑把に言うと、尖った声の値が大きいほど理解しやすく、まろやかな声の値が小さいほど理解しやすい。
これら4つのカスタマイズ・オプションをコントロールすることで同じ音色を選んでも、まったく違う音にチューニングできるので、試してみると本当に楽しい!.
もう一つのコツは、ポーズを追加する必要がある場所に''を追加することです。この種のマーカーは、モデルが指定された時間だけ音をポーズさせることができます。
強力なジェネレーション効果
コンクモデルのオントロジーに加えて、豊富な音色も非常に強力であることに加えて、我々はいくつかのオープンソースのTTSを使用している最も一般的な問題の多くのモデルが音質の問題であることを知っている、電流の感覚があり、いくつかの歪みは、いくつかは意図的にいくつかのトレーニングの問題である追加されます。
ここで、私が少し前に彼のために書いた比較的長いパラグラフを見つけた。音質がとてもよく、間が自然で、必要なときには強調する。.
音声モデリングでよくあるもう一つの問題は、非常に長いコンテンツの生成である。多くのモデルは非常に短いテキストをサポートしているが、コンチは最大10,000文字をサポートしている。基本的に、長めの原稿や章立ての小説の長さはこれくらいで十分だ。
以下は、私は彼が非常によく、何の問題も読んで原稿の呉エンダ2000語を発見した前の期間であり、速度の生成も非常に高速であり、彼は非常に時間を節約し、プレビューしながら生成することができます!
最後の最も厄介な問題は、多言語混合シーンとポリフォニックシーンであり、いくつかの比較的良好な音声モデルもしばしば問題があり、具体的には、AIがテストテキストを生成してみましょう、段落は5つの異なる言語が含まれており、コンクは完璧に読んで、これは本当に強すぎる。
おはようございます! お会いできてとても嬉しいです。 音楽と芸術が大好きです。 とても幸せです。ブエノス・ディアス・アミーゴス! ランチに行きましょう。
これは多声の場面だが、彼は「歩く」(háng)、「最初」(xíng)、「銀行」(háng)、「旅行」(xíng)のそれぞれの位置の発音を正確に判断し、非常に複雑な多声の発話をうまく処理している。
今日は一歩進んで、一本入ったら止まる。明日は銀行に行かなければならないので、渋滞にはまると予定に影響が出るかもしれない。
紹介は以上だが、もっと遊んだり、次のような場所で使うことができる:
コンク・ヴォイス:https://hailuoai.com/audioヘイルオ
国内APIサービス:https://platform.minimaxi.com/document/T2AV2
昨年は、中国にイレブンラボのような強力なボイスオーバー製品がいつ出るかと友人といつも話していましたが、イレブンラボ以上の結果を出し、24年間で画像から映像、音声までクラス最高レベルに匹敵するモデルを出してきましたので、今年は国内のAIベンダーにもっと驚きを与えてもらいたいです。