AIボイス・クローン

全41記事

順番に並べる

目を通すブックマーク

Conch Speech (MiniMax Audio): 自然な音声を生成するAIツール

包括的な紹介 MiniMax AudioはMiniMax社のAI音声生成ツールで、テキストを類似度の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルに基づいており、音声合成の類似度は最大99...

最新のAIリソース # AI音声合成 # AIボイスクローニング

10ヶ月前

0128.9K

MegaTTS3：中国語音声と英語音声を合成する軽量モデル

包括的な紹介 MegaTTS3は、ByteDanceが浙江大学と共同で開発したオープンソースの音声合成ツールで、高品質な中国語と英語の音声を生成することに重点を置いています。MegaTTS3のコアモデルは、わずか0.45Bパラメータで、軽量かつ効率的です。このプロジェクトは ...

1年前

068.3K

Seed-VC：少ないサンプル数で音声と歌のリアルタイム変換に対応

概要 Seed-VCはPlachtaaによって開発されたGitHub上のオープンソースプロジェクトです。Seed-VCは、1秒から30秒のリファレンスオーディオを使用することができます。このプロジェクトは、リアルタイムの音声変換、ディレイ変換、音声合成をサポートしています。

1年前

0164.4K

CSMボイスクローニング：CSM-1Bによる高速ボイスクローニング

概要 CSM Voice Cloningは、Isaiah Bjorkによって開発され、GitHubでホストされているオープンソースプロジェクトです。このプロジェクトはSesame CSM-1Bモデルに基づいており、ユーザは音声サンプルを提供するだけでクローンを作成することができます。

1年前

055K

PlayHT：超リアルな音声を生成するAIツール

概要 PlayHTは、AI音声生成に特化した効率的なオンラインプラットフォームで、ユーザーがテキストを自然でリアルな音声に素早く変換できるよう支援します。60以上の言語と多様なアクセントをサポートする600以上のAI音声を提供し、ポッドキャスト制作、教育コンテンツ、マーケティングプロモーション...

最新のAIリソース # AI音声合成 # AIボイスクローニング

1年前

057K

Spark-TTS：自然な音声を生成する音声合成ツール

概要 Spark-TTSは、SparkAudioチームによって開発され、GitHubでホストされているオープンソースの音声合成（TTS）ツールで、ユーザーがテキストを自然で滑らかな音声に効率的に変換できるように設計されています。

1年前

072.1K

Step-Audio：マルチモーダル音声インタラクションフレームワーク。

包括的な紹介 Step-Audioはオープンソースのインテリジェント音声対話フレームワークであり、制作環境において、すぐに使える音声理解と音声生成機能を提供するように設計されています。このフレームワークは、多言語会話（例：中国語、英語、日本語）、感情音声（例：嬉しい、悲しい）、地域方言（例：広東語、四川語、中国語、英語、日本語）をサポートしています。

1年前

073.4K

Zonos: 高品質音声合成と音声クローニングツール

一般的な紹介 ZonosはZyphraによって開発されたオープンソースの音声合成と音声クローニングツールです。Zonos-v0.1バージョンは、高品質の音声出力を生成するために高度なトランスフォーマーとブレンドモデルを使用しています。このツールは複数の言語をサポートしています。

1年前

067.2K

Weights：声真似カバーソングと音声合成オーサリングプラットフォーム

はじめに Weightsは、簡単な操作でボイスカバー、音声合成、画像、音楽、動画を作成できる、AIを活用したクリエイティビティのためのソーシャルプラットフォームです。このプラットフォームは、ユーザーが素早く創作を始め、コミュニティと共有できるよう、豊富なツールやテンプレートを提供しています。

最新のAIリソース # AI音声合成 # AIボイスクローニング

1年前

0123.9K

AnyVoice: 無料オンラインボイスクローニング！

概論 AnyVoiceは高度なAI音声生成プラットフォームであり、超リアルな音声生成と音声クローンサービスを提供します。ユーザーはテキストを自然な音声に変換し、数百のプリセット音声から選択することができます。適切な音声が見つからない場合は、...

最新のAIリソース # AI音声合成 # AIボイスクローニング

1年前

081.9K

Llasa 1~8B: 高品質音声生成とクローニングのためのオープンソース音声合成モデル

概要 Llasa-3Bは、香港科学技術大学オーディオ研究室（HKUST Audio）が開発したオープンソースの音声合成（TTS）モデルです。このモデルはLlama 3.2Bアーキテクチャに基づいており、複数の音声合成をサポートするだけでなく、高品質な音声合成を提供するために慎重に調整されています。

1年前

074.4K

Fish Agent：端到端AI语音克隆助手，实时语音对话助理，Fish Speech衍生项目

フィッシュ・エージェント：エンド・ツー・エンドのAIボイス・クローン・アシスタント、リアルタイム音声対話アシスタント、フィッシュ・スピーチ・スピンオフ・プロジェクト

包括的な紹介フィッシュ・スピーチ派生プロジェクトフィッシュ・エージェントは、V0.1 3Bモデル・アーキテクチャに基づいて開発された、革命的なエンド・ツー・エンドのAIスピーチ・クローン・システムです。完全なエンド・ツー・エンドの音声クローン処理システムとして、その最大の特徴は、革新的なスピーチレス...

1年前

070.7K

ViiTor AI：音声・映像の多言語翻訳合成と音声クローン作成サービス

総合紹介 ViiTor AIは、高品質な動画翻訳、ボイスクローン、AI生成アバター動画、音声合成サービスの提供に特化した強力な人工知能プラットフォームです。このプラットフォームは多言語をサポートし、ユーザーが簡単に多言語コンテンツ作成を実現できることを目指しています。

1年前

081.2K

Voicemod：リアルタイムボイスチェンジャー、ボイスチャット、ゲームボイス変更

概要 Voicemodは、WindowsとmacOS用のリアルタイムボイスチェンジャーとサウンドエフェクトソフトウェアのリーディングカンパニーです。ゲームでのロールプレイ、友達とのチャット、ライブストリーミングなど、Voicemodは豊富なボイスチェンジを提供します。

最新のAIリソース # AIボイスクローニング

1年前

080.6K

Amphion MaskGCT: ゼロサンプル音声合成クローンモデル (ローカルのワンクリックデプロイパッケージ)

包括的な紹介 MaskGCT (Masked Generative Codec Transformer)は、Funky Maru Technologyと香港中文大学が共同で導入した完全非自律回帰型音声合成(TTS)モデルである。このモデルは明示的な音声合成を必要としない。

1年前

084.9K

ファンキー丸千代：声のクローンと口のシンクロを組み合わせ、ワンクリックでビデオを多言語に翻訳！

総合紹介 Funmaru Thousand Voicesは、リアルで自然な音声生成ソリューションを提供する多言語AI音声合成プラットフォームです。ユーザーは、テキストコンテンツを簡単にプロ級の音声に変換することができ、個人のニーズに合わせてゼロサンプルから専用のAIボイス（ボイスクローン）の作成をサポートします。また、このプラットフォームはビデオ翻訳機能も提供し、...

最新のAIリソース # AI翻訳 # AIボイスクローニング

1年前

052.3K

CosyVoice：3秒間の突進ボイス・クローニング・オープンソース・プロジェクトがアリによって立ち上げられる。

包括的な紹介 CosyVoiceは、推論、トレーニングからデプロイまでフルスタックの機能を提供する多言語大規模音声生成モデルです。FunAudioLLMチームによって開発され、高度な自己回帰変換器とODEベースの拡散モデルにより、高品質な音声の実現を目指しています。

1年前

0164.3K

コンクAIビデオジェネレーター：テキストまたは画像から高品質のビデオ、映画、TVグレードの映像作成が可能

概要 Conch AI Video GeneratorはMiniMaxが開発した先進的なAIビデオ生成ツールです。ユーザーは簡単なテキストを入力するか、画像をアップロードするだけで、Conch AIは高品質なビデオコンテンツを素早く生成することができます。このツールは、クリエイター、マーケティング担当者、ストーリー担当者などに広く利用されています。

1年前

074.3K

Coqui TTS（xTTS）：文本到语音生成的深度学习工具包，支持多种语言和声音克隆功能

Coqui TTS (xTTS)：多言語サポートと音声クローン機能を備えた音声合成用ディープラーニングツールキット

包括的な紹介 Coqui TTSは、ディープラーニング技術に基づくオープンソースの高度な音声合成（TTS）ツールキットです。Coqui TTSは、研究環境と実運用環境の両方でテストされており、多言語のテキスト音声変換をサポートする豊富な機能とモデルのセットを提供します。

1年前

0109.9K

F5-TTS: 滑らかで感情豊かなクローン音声を生成するサンプルレス・スピーチ・クローニング

包括的な紹介 F5-TTSは、ストリームにマッチした拡散変換器(DiT)に基づく、新しい非自己回帰的音声合成(TTS)システムである。このシステムは、ConvNeXtモデルを用いてテキスト表現を最適化する。

1年前

094.8K

ボイスチェンジャー：お気に入りのアニメキャラクターを歌わせるリアルタイムボイスチェンジャー！

概要 Voice Changerはオープンソースのリアルタイム音声変換ツールで、MMVC、so-vits-svc、RVC、DDSP-SVC、Beatriceなどの幅広いAI音声モデルをサポートしています。

1年前

069K

MockingBird：快速克隆声音与模型训练，基于 xtts v2 实现的文本转语音

MockingBird: 高速音声クローニングとモデルトレーニング、xtts v2に基づく音声合成

包括的な紹介 MockingBirdはオープンソースプロジェクトであり、AI技術を通じて、迅速な音声クローンと音声合成を実現することを目指している。ユーザーは5秒間の音声サンプルを提供するだけで、どのような音声コンテンツでも生成できる。このプロジェクトは様々な中国語データセットをサポートし、Windows ...

1年前

062K

Clone Voice：支持多语言的少样本声音克隆工具，基于xtts_v2提供Windows一键安装包

クローンボイス：Windows用のxtts_v2をベースにした多言語、サンプルレス音声クローンツール。

一般的な説明 Clone Voiceはオープンソースのサウンドクローニングツールで、ウェブベースのインターフェイスを提供し、ユーザーが任意のサウンドや個人的な声の録音を使用して声のクローンを作成することができます。このツールは、NVIDIA GPUがなくても簡単に使用でき、コンパイル済みのアプリで使用できます。

1年前

076.8K

Retrieval based Voice Conversion WebUI：基于检索的语音转换框架|模拟真人歌声

検索ベースの音声変換WebUI：検索ベースの音声変換フレームワーク｜実際の歌声をシミュレートする

包括的な導入検索に基づく音声変換WebUIは、使いやすいVITSベースの音声変換フレームワークであり、曲のカバーやリアルタイムの音声変更を含む、あらゆるスピーカー間の音声変換を可能にします。低 ...

1年前

066.3K

ReechoAI：超フェイクAI音声合成・瞬間クローンプラットフォーム

包括的な紹介 Reecho AI (Reecho) は、高度なAI技術を活用した超忠実度のAI音声合成およびインスタントクローンプラットフォームで、ユーザーは音声サンプルをアップロードまたは録音することで、特定の音声キャラクターを素早く作成し、クローン化することができます。このプラットフォームは、より短い音声サンプルから音声サンプルを作成する機能を備えています。

最新のAIリソース # AIボイスクローニング

1年前

056.7K

Zide Speech: インテリジェント音声合成プラットフォーム|音声クローニング

総合紹介 Zide Voiceは高度なAI技術を利用した音声合成プラットフォームである。ユーザーは音声をアップロードするだけで、テキストを加えてリアルで感情的な音声クリップを生成することができる。このプラットフォームは、迅速なキャラクターカスタマイズ、クラウドベースの音声生成、擬人化音声合成などの機能を備えている。ソフトウェアをダウンロードする必要はありません。

最新のAIリソース # AIボイスクローニング

1年前

056.5K

VoiceCraft: オープンソースゼロサンプル音声クローニング・音声合成ツール

包括的な紹介 VoiceCraftは、ニューラルコーデック言語モデルに基づいたオープンソースの音声編集およびゼロサンプル音声合成ツールです。革新的な符号化シーケンス生成方法を採用しており、既存の音声シーケンスに対して挿入、削除、置換操作を行うことで、自然で首尾一貫した編集音声を生成することができます。

1年前

066.6K

海藻AI：インテリジェント音声合成と音声クローニング・プラットフォーム

総合紹介 Seaweed AIは、Yun Zhisheng AIオープンプラットフォームを搭載した、オンラインでテキストを音声に変換できるインテリジェントなダビング製品です。ユーザー自身が音声クローンを作成し、性別、アクセント、言語の異なるAI発音者を提供し、テキスト入力後に直接音声をダビングすることができます。また、テキストを入力した後、直接音声をダビングすることもできます。

最新のAIリソース # AI音声合成 # AIボイスクローニング

1年前

050K

Resemble AI：人工知能音声合成プラットフォーム｜ボイスクローン｜ディープフェイクオーディオ検出

総合紹介リセンブルAIは、企業向けに設計された人工知能音声合成プラットフォームです。このプラットフォームは、最先端のAI音声生成技術と、将来の情報セキュリティのためのディープフェイクオーディオ検出を提供します。特徴として、音声クローニング、リアルタイムな偽造音声検出、AI透かし技術...

最新のAIリソース # AI音声合成 # AIボイスクローニング

2年前

057.3K

マジック・ボイス・ワークショップ：プロフェッショナル・ボイスオーバー＆ショートビデオ・ナレーション作成プラットフォーム｜リアル・パーソン・ボイスオーバー｜クローン・ボイス｜ワンクリックで映像化

総合紹介マジックボイス工房は、ソフトウェアアフレコ、リアルアフレコ、サウンドライブラリ、クローンサービスなどの情報をワンストップで提供するショートビデオ・AIアフレコプラットフォームです。このプラットフォームは、音声編集、AIコピー生成、ビデオ編集、音声関連サービスやコンテンツ制作のためのコラボレーションツールを統合しています。ユーザーはオーディオ編集を体験...

2年前

066.1K

Listnr: 多言語AIスピーチジェネレーター、革新的な人間の音声合成技術

一般的な紹介 Listnrは、142以上の言語、1,000以上の異なる声で音声合成を作成するジェネレーティブAIエンジンを搭載した音声合成ソフトウェアです。このプラットフォームは、ショートビデオ、YouTub...

最新のAIリソース # AI音声合成 # AIボイスクローニング

2年前

061.2K

ディグリー・プラス：コピーライティングをワンクリックでフィルムに、クローンサウンドとハイライトを急いで編集

総合紹介 Duga Creation Toolは、バイドゥが立ち上げたAIGC（Artificial Intelligence Generated Content）制作プラットフォームで、AI技術によってコンテンツ制作の敷居を下げ、制作効率を向上させることを目的としている。このプラットフォームは、バイドゥの複数のAIGC機能を集約し、インスピレーションから完成品までのワンストップ制作サービスを提供する。Dugaの主な...

2年前

052.6K

Uberduck: AIがラップと音声を生成するプラットフォーム｜Text to Speech｜テキスト・トゥ・スピーチ

概要 Uberduck AIは、クリエイティブ・エージェンシー、音楽プロデューサー、プログラマー向けに、歌声や話し声のAI合成を提供する革新的なプラットフォームです。ユーザーは、さまざまな音楽のリズムを選択し、AIを使って歌詞を生成したり、自分で書いたり、特定のサウンドを選択して、最終的にラップソングを作成することができます...

2年前

057.6K

GPT SoVITS：画期的な音声生成・音声クローニングツール

総合紹介 GPT-SoVITSは、GPTモデルとSoVITSボイスチェンジャー技術を組み合わせたオープンソースの音声変換・合成ツールです。このツールは、0サンプルや数サンプルでのオンザフライテキスト音声変換や、わずか5秒間の音声サンプルでの音声スタイル移行をサポートしています。このツールの特徴には、言語横断的な音声合成が含まれます。

2年前

081.5K

フィッシュ・スピーチ：少ないサンプル数で中国語と英語の音声を高速かつ高精度にクローニング

概要フィッシュ・スピーチはフィッシュ・オーディオが開発したオープンソースの音声合成ツールです。このツールはVQ-GAN、Llama、VITSなどの最先端のAI技術に基づいており、テキストをリアルな音声に変換することができます。

1年前

082K

イレブンラボ：高品質AI音声生成プラットフォーム、テキストダビング、音声クローニングツール

はじめにイレブンラボは、米国ニューヨークに拠点を置く、ジェネレーティブAIスピーチの分野に特化した新興企業である。同社は、テキスト生成音声、スピーチ生成音声、音声クローン、音声認識のための強力なサービスを提供しています。

最新のAIリソース # AI音声合成 # AIボイスクローニング

2年前

056.7K

Easy Voice Toolkit: 地域展開のためのAI音声ツールキット

包括的な紹介 Easy-Voice-ToolkitはOpen Source Speech Projectに基づく多機能なツールキットで、音声認識、音声トランスクリプション、音声変換、データセット作成、モデルトレーニングのための幅広い自動音声ツールを提供します。ユーザーは、必要に応じてこれらのツールを選択的に使用することができます...

2年前

062.2K

Vidnoz AI：たった1枚の写真でデジタル人語動画を生成、複数の無料動画生成ツール

概要説明 Vidnozは、1分以内に素早くAIビデオを作成するための無料のAIビデオ生成プラットフォームです。費用、ダウンロード、経験は必要ありません。このプラットフォームは、500以上のAIアバター、470以上のリアルなAIナレーション、500以上のテンプレートを提供しています。VidnozのAIビデオ...

2年前

081.9K

Rask AI: プロフェッショナルな音声クローニングによるビデオ多言語翻訳、ビデオローカリゼーションツール

概要 Rask AIは、クリエイター、教育者、グローバルビジネス向けに、迅速なオーディオおよびビデオ制作ソリューションを提供するために設計されたインテリジェントビデオローカリゼーションプラットフォームです。このプラットフォームは、130以上の言語へのビデオとオーディオの自動翻訳をサポートし、ユーザーのグローバル市場への進出を支援します。特別な機能として、ビデオ...

最新のAIリソース # AIボイスクローニング

2年前

054.6K

ありがとうデジタルヒューマン：バーチャル映像放映・リアルタイム交流プラットフォーム|無料クローンデジタルヒューマン制作

総合紹介 Wealth Digital Peopleは、先進的なAI技術を統合したプラットフォームで、バーチャル映像放送とリアルタイムの双方向サービスの提供に重点を置いている。このプラットフォームは、自社開発した音声認識、音声合成、マルチモーダル知覚、文書Q&A技術を使って、リアルなデジタル人間ドッペルゲンガーをユーザーに作成し、映像制作、翻訳、教育などをサポートする。

最新のAIリソース # AIデジタルマン # AIボイスクローニング

2年前

050.3K

OpenVoice (MyShell)：少ないサンプルで多言語の音声クローニングが可能

概論 OpenVoiceは、リファレンススピーカーの音声をコピーし、スピーカーの短いオーディオクリップのみを使用して多言語音声を生成することができる、インスタントスピーチクローニングの多用途な方法です。OpenVoiceでは、音色のコピーだけでなく、感情的な表現など、声のスタイルを細かくコントロールすることができます。

1年前

0152.2K

そうではない。