AIボイス・クローン

全41記事
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3:中国語音声と英語音声を合成する軽量モデル

包括的な紹介 MegaTTS3は、ByteDanceが浙江大学と共同で開発したオープンソースの音声合成ツールで、高品質な中国語と英語の音声を生成することに重点を置いています。MegaTTS3のコアモデルは、わずか0.45Bパラメータで、軽量かつ効率的です。このプロジェクトは ...
4ヶ月前
01.4K
Seed-VC:支持少样本实时转换语音和歌声

Seed-VC:少ないサンプル数で音声と歌のリアルタイム変換に対応

概要 Seed-VCはPlachtaaによって開発されたGitHub上のオープンソースプロジェクトです。Seed-VCは、1秒から30秒のリファレンスオーディオを使用することができます。このプロジェクトは、リアルタイムの音声変換、ディレイ変換、音声合成をサポートしています。
5ヶ月前
01.7K
CSM Voice Cloning:利用CSM-1B快速克隆声音

CSMボイスクローニング:CSM-1Bによる高速ボイスクローニング

概要 CSM Voice Cloningは、Isaiah Bjorkによって開発され、GitHubでホストされているオープンソースプロジェクトです。このプロジェクトはSesame CSM-1Bモデルに基づいており、ユーザは音声サンプルを提供するだけでクローンを作成することができます。
5ヶ月前
01.6K
PlayHT:生成超真实语音的AI工具

PlayHT:超リアルな音声を生成するAIツール

概要 PlayHTは、AI音声生成に特化した効率的なオンラインプラットフォームで、ユーザーがテキストを自然でリアルな音声に素早く変換できるよう支援します。60以上の言語と多様なアクセントをサポートする600以上のAI音声を提供し、ポッドキャスト制作、教育コンテンツ、マーケティングプロモーション...
5ヶ月前
01.4K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio:マルチモーダル音声インタラクションフレームワーク。

包括的な紹介 Step-Audioはオープンソースのインテリジェント音声対話フレームワークであり、制作環境において、すぐに使える音声理解と音声生成機能を提供するように設計されています。このフレームワークは、多言語会話(例:中国語、英語、日本語)、感情音声(例:嬉しい、悲しい)、地域方言(例:広東語、四川語、中国語、英語、日本語)をサポートしています。
6ヶ月前
02.1K
Zonos:高质量语音合成与语音克隆工具

Zonos: 高品質音声合成と音声クローニングツール

一般的な紹介 ZonosはZyphraによって開発されたオープンソースの音声合成と音声クローニングツールです。Zonos-v0.1バージョンは、高品質の音声出力を生成するために高度なトランスフォーマーとブレンドモデルを使用しています。このツールは複数の言語をサポートしています。
6ヶ月前
02.2K
Weights:模仿声音翻唱歌曲和文本转语音的创作平台

Weights:声真似カバーソングと音声合成オーサリングプラットフォーム

はじめに Weightsは、簡単な操作でボイスカバー、音声合成、画像、音楽、動画を作成できる、AIを活用したクリエイティビティのためのソーシャルプラットフォームです。このプラットフォームは、ユーザーが素早く創作を始め、コミュニティと共有できるよう、豊富なツールやテンプレートを提供しています。
6ヶ月前
02.6K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: 高品質音声生成とクローニングのためのオープンソース音声合成モデル

概要 Llasa-3Bは、香港科学技術大学オーディオ研究室(HKUST Audio)が開発したオープンソースの音声合成(TTS)モデルです。このモデルはLlama 3.2Bアーキテクチャに基づいており、複数の音声合成をサポートするだけでなく、高品質な音声合成を提供するために慎重に調整されています。
6ヶ月前
02.1K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

フィッシュ・エージェント:エンド・ツー・エンドのAIボイス・クローン・アシスタント、リアルタイム音声対話アシスタント、フィッシュ・スピーチ・スピンオフ・プロジェクト

包括的な紹介 フィッシュ・スピーチ派生プロジェクト フィッシュ・エージェントは、V0.1 3Bモデル・アーキテクチャに基づいて開発された、革命的なエンド・ツー・エンドのAIスピーチ・クローン・システムです。完全なエンド・ツー・エンドの音声クローン処理システムとして、その最大の特徴は、革新的なスピーチレス...
7ヶ月前
02.1K
ViiTor AI:音频/视频多语言翻译合成与语音克隆服务

ViiTor AI:音声・映像の多言語翻訳合成と音声クローン作成サービス

総合紹介 ViiTor AIは、高品質な動画翻訳、ボイスクローン、AI生成アバター動画、音声合成サービスの提供に特化した強力な人工知能プラットフォームです。このプラットフォームは多言語をサポートし、ユーザーが簡単に多言語コンテンツ作成を実現できることを目指しています。
8ヶ月前
02.9K
Voicemod:实时变声器,语音聊天、游戏变声

Voicemod:リアルタイムボイスチェンジャー、ボイスチャット、ゲームボイス変更

概要 Voicemodは、WindowsとmacOS用のリアルタイムボイスチェンジャーとサウンドエフェクトソフトウェアのリーディングカンパニーです。ゲームでのロールプレイ、友達とのチャット、ライブストリーミングなど、Voicemodは豊富なボイスチェンジを提供します。
8ヶ月前
02.4K
Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)

Amphion MaskGCT: ゼロサンプル音声合成クローンモデル (ローカルのワンクリックデプロイパッケージ)

包括的な紹介 MaskGCT (Masked Generative Codec Transformer)は、Funky Maru Technologyと香港中文大学が共同で導入した完全非自律回帰型音声合成(TTS)モデルである。このモデルは明示的な音声合成を必要としない。
9ヶ月前
02.7K
趣丸千音:语音克隆并结合口型同步,一键翻译视频为多语言!

ファンキー丸千代:声のクローンと口のシンクロを組み合わせ、ワンクリックでビデオを多言語に翻訳!

総合紹介 Funmaru Thousand Voicesは、リアルで自然な音声生成ソリューションを提供する多言語AI音声合成プラットフォームです。ユーザーは、テキストコンテンツを簡単にプロ級の音声に変換することができ、個人のニーズに合わせてゼロサンプルから専用のAIボイス(ボイスクローン)の作成をサポートします。また、このプラットフォームはビデオ翻訳機能も提供し、...
8ヶ月前
02.1K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice:3秒間の突進ボイス・クローニング・オープンソース・プロジェクトがアリによって立ち上げられる。

包括的な紹介 CosyVoiceは、推論、トレーニングからデプロイまでフルスタックの機能を提供する多言語大規模音声生成モデルです。FunAudioLLMチームによって開発され、高度な自己回帰変換器とODEベースの拡散モデルにより、高品質な音声の実現を目指しています。
6ヶ月前
03.8K
海螺AI视频生成器:文本或图像生成高质量视频,影视级镜头创作

コンクAIビデオジェネレーター:テキストまたは画像から高品質のビデオ、映画、TVグレードの映像作成が可能

概要 Conch AI Video GeneratorはMiniMaxが開発した先進的なAIビデオ生成ツールです。ユーザーは簡単なテキストを入力するか、画像をアップロードするだけで、Conch AIは高品質なビデオコンテンツを素早く生成することができます。このツールは、クリエイター、マーケティング担当者、ストーリー担当者などに広く利用されています。
8ヶ月前
02.3K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS (xTTS):多言語サポートと音声クローン機能を備えた音声合成用ディープラーニングツールキット

包括的な紹介 Coqui TTSは、ディープラーニング技術に基づくオープンソースの高度な音声合成(TTS)ツールキットです。Coqui TTSは、研究環境と実運用環境の両方でテストされており、多言語のテキスト音声変換をサポートする豊富な機能とモデルのセットを提供します。
6ヶ月前
02.1K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

MockingBird: 高速音声クローニングとモデルトレーニング、xtts v2に基づく音声合成

包括的な紹介 MockingBirdはオープンソースプロジェクトであり、AI技術を通じて、迅速な音声クローンと音声合成を実現することを目指している。ユーザーは5秒間の音声サンプルを提供するだけで、どのような音声コンテンツでも生成できる。このプロジェクトは様々な中国語データセットをサポートし、Windows ...
8ヶ月前
02.3K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

クローンボイス:Windows用のxtts_v2をベースにした多言語、サンプルレス音声クローンツール。

一般的な説明 Clone Voiceはオープンソースのサウンドクローニングツールで、ウェブベースのインターフェイスを提供し、ユーザーが任意のサウンドや個人的な声の録音を使用して声のクローンを作成することができます。このツールは、NVIDIA GPUがなくても簡単に使用でき、コンパイル済みのアプリで使用できます。
10ヶ月前
02.3K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

検索ベースの音声変換WebUI:検索ベースの音声変換フレームワーク|実際の歌声をシミュレートする

包括的な導入検索に基づく音声変換WebUIは、使いやすいVITSベースの音声変換フレームワークであり、曲のカバーやリアルタイムの音声変更を含む、あらゆるスピーカー間の音声変換を可能にします。低 ...
10ヶ月前
02.2K
ReechoAI(睿声):超拟真AI语音合成与瞬时克隆平台

ReechoAI:超フェイクAI音声合成・瞬間クローンプラットフォーム

包括的な紹介 Reecho AI (Reecho) は、高度なAI技術を活用した超忠実度のAI音声合成およびインスタントクローンプラットフォームで、ユーザーは音声サンプルをアップロードまたは録音することで、特定の音声キャラクターを素早く作成し、クローン化することができます。このプラットフォームは、より短い音声サンプルから音声サンプルを作成する機能を備えています。
10ヶ月前
02.4K
自得语音:智能语音合成平台|语音克隆

Zide Speech: インテリジェント音声合成プラットフォーム|音声クローニング

総合紹介 Zide Voiceは高度なAI技術を利用した音声合成プラットフォームである。ユーザーは音声をアップロードするだけで、テキストを加えてリアルで感情的な音声クリップを生成することができる。このプラットフォームは、迅速なキャラクターカスタマイズ、クラウドベースの音声生成、擬人化音声合成などの機能を備えている。ソフトウェアをダウンロードする必要はありません。
10ヶ月前
02K
VoiceCraft:开源零样本语音克隆与文本转语音工具

VoiceCraft: オープンソース ゼロサンプル音声クローニング・音声合成ツール

包括的な紹介 VoiceCraftは、ニューラルコーデック言語モデルに基づいたオープンソースの音声編集およびゼロサンプル音声合成ツールです。革新的な符号化シーケンス生成方法を採用しており、既存の音声シーケンスに対して挿入、削除、置換操作を行うことで、自然で首尾一貫した編集音声を生成することができます。
10ヶ月前
02.2K
海藻AI:智能语音合成与声音克隆平台

海藻AI:インテリジェント音声合成と音声クローニング・プラットフォーム

総合紹介 Seaweed AIは、Yun Zhisheng AIオープンプラットフォームを搭載した、オンラインでテキストを音声に変換できるインテリジェントなダビング製品です。ユーザー自身が音声クローンを作成し、性別、アクセント、言語の異なるAI発音者を提供し、テキスト入力後に直接音声をダビングすることができます。また、テキストを入力した後、直接音声をダビングすることもできます。
10ヶ月前
02.1K
Resemble AI:人工智能语音合成平台|声音克隆|深度伪造音频检测

Resemble AI:人工知能音声合成プラットフォーム|ボイスクローン|ディープフェイクオーディオ検出

総合紹介 リセンブルAIは、企業向けに設計された人工知能音声合成プラットフォームです。このプラットフォームは、最先端のAI音声生成技術と、将来の情報セキュリティのためのディープフェイクオーディオ検出を提供します。特徴として、音声クローニング、リアルタイムな偽造音声検出、AI透かし技術...
10ヶ月前
02K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

マジック・ボイス・ワークショップ:プロフェッショナル・ボイスオーバー&ショートビデオ・ナレーション作成プラットフォーム|リアル・パーソン・ボイスオーバー|クローン・ボイス|ワンクリックで映像化

総合紹介 マジックボイス工房は、ソフトウェアアフレコ、リアルアフレコ、サウンドライブラリ、クローンサービスなどの情報をワンストップで提供するショートビデオ・AIアフレコプラットフォームです。このプラットフォームは、音声編集、AIコピー生成、ビデオ編集、音声関連サービスやコンテンツ制作のためのコラボレーションツールを統合しています。ユーザーはオーディオ編集を体験...
10ヶ月前
01.7K
度加:文案一键成片,急速克隆声音和剪辑精彩片段

ディグリー・プラス:コピーライティングをワンクリックでフィルムに、クローンサウンドとハイライトを急いで編集

総合紹介 Duga Creation Toolは、バイドゥが立ち上げたAIGC(Artificial Intelligence Generated Content)制作プラットフォームで、AI技術によってコンテンツ制作の敷居を下げ、制作効率を向上させることを目的としている。このプラットフォームは、バイドゥの複数のAIGC機能を集約し、インスピレーションから完成品までのワンストップ制作サービスを提供する。Dugaの主な...
11ヶ月前
01.9K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: AIがラップと音声を生成するプラットフォーム|Text to Speech|テキスト・トゥ・スピーチ

概要 Uberduck AIは、クリエイティブ・エージェンシー、音楽プロデューサー、プログラマー向けに、歌声や話し声のAI合成を提供する革新的なプラットフォームです。ユーザーは、さまざまな音楽のリズムを選択し、AIを使って歌詞を生成したり、自分で書いたり、特定のサウンドを選択して、最終的にラップソングを作成することができます...
11ヶ月前
02.1K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS:画期的な音声生成・音声クローニングツール

総合紹介 GPT-SoVITSは、GPTモデルとSoVITSボイスチェンジャー技術を組み合わせたオープンソースの音声変換・合成ツールです。このツールは、0サンプルや数サンプルでのオンザフライテキスト音声変換や、わずか5秒間の音声サンプルでの音声スタイル移行をサポートしています。このツールの特徴には、言語横断的な音声合成が含まれます。
11ヶ月前
02.2K
Fish Speech:快速且高精度使用少样本克隆中英文语音

フィッシュ・スピーチ:少ないサンプル数で中国語と英語の音声を高速かつ高精度にクローニング

概要 フィッシュ・スピーチはフィッシュ・オーディオが開発したオープンソースの音声合成ツールです。このツールはVQ-GAN、Llama、VITSなどの最先端のAI技術に基づいており、テキストをリアルな音声に変換することができます。
6ヶ月前
02.7K
ElevenLabs:高质量AI语音生成平台,文字配音和语音克隆工具

イレブンラボ:高品質AI音声生成プラットフォーム、テキストダビング、音声クローニングツール

はじめに イレブンラボは、米国ニューヨークに拠点を置く、ジェネレーティブAIスピーチの分野に特化した新興企業である。同社は、テキスト生成音声、スピーチ生成音声、音声クローン、音声認識のための強力なサービスを提供しています。
11ヶ月前
02.5K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: 地域展開のためのAI音声ツールキット

包括的な紹介 Easy-Voice-ToolkitはOpen Source Speech Projectに基づく多機能なツールキットで、音声認識、音声トランスクリプション、音声変換、データセット作成、モデルトレーニングのための幅広い自動音声ツールを提供します。ユーザーは、必要に応じてこれらのツールを選択的に使用することができます...
11ヶ月前
02.3K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI:たった1枚の写真でデジタル人語動画を生成、複数の無料動画生成ツール

概要説明 Vidnozは、1分以内に素早くAIビデオを作成するための無料のAIビデオ生成プラットフォームです。費用、ダウンロード、経験は必要ありません。このプラットフォームは、500以上のAIアバター、470以上のリアルなAIナレーション、500以上のテンプレートを提供しています。VidnozのAIビデオ...
12ヶ月前
02.7K
Rask AI:视频多语言翻译与专业语音克隆,视频本地化工具

Rask AI: プロフェッショナルな音声クローニングによるビデオ多言語翻訳、ビデオローカリゼーションツール

概要 Rask AIは、クリエイター、教育者、グローバルビジネス向けに、迅速なオーディオおよびビデオ制作ソリューションを提供するために設計されたインテリジェントビデオローカリゼーションプラットフォームです。このプラットフォームは、130以上の言語へのビデオとオーディオの自動翻訳をサポートし、ユーザーのグローバル市場への進出を支援します。特別な機能として、ビデオ...
12ヶ月前
02.7K
有道数字人:虚拟形象播报与实时交互平台|免费制作克隆数字人

ありがとうデジタルヒューマン:バーチャル映像放映・リアルタイム交流プラットフォーム|無料クローンデジタルヒューマン制作

総合紹介 Wealth Digital Peopleは、先進的なAI技術を統合したプラットフォームで、バーチャル映像放送とリアルタイムの双方向サービスの提供に重点を置いている。このプラットフォームは、自社開発した音声認識、音声合成、マルチモーダル知覚、文書Q&A技術を使って、リアルなデジタル人間ドッペルゲンガーをユーザーに作成し、映像制作、翻訳、教育などをサポートする。
12ヶ月前
02.1K
OpenVoice(MyShell):多语言少样本即时语音克隆

OpenVoice (MyShell):少ないサンプルで多言語の音声クローニングが可能

概論 OpenVoiceは、リファレンススピーカーの音声をコピーし、スピーカーの短いオーディオクリップのみを使用して多言語音声を生成することができる、インスタントスピーチクローニングの多用途な方法です。OpenVoiceでは、音色のコピーだけでなく、感情的な表現など、声のスタイルを細かくコントロールすることができます。
9ヶ月前
02.2K