AI音声合成

全79記事

順番に並べる

Sherpa-ONNX: ONNXRuntimeによるオフライン音声認識と合成

概要 sherpa-onnxは、Next-gen Kaldiチームによって開発されたオープンソースプロジェクトで、効率的なオフライン音声認識および音声合成ソリューションを提供します。Android、iOS、Raspber...など複数のプラットフォームをサポートしています。

1年前

0319K

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声

SoniTranslate: オープンソース動画翻訳ダビングソリューション、複数ダビング、速度調整、オリジナルサウンドの模倣

概要 SoniTranslate はパワフルでユーザーフレンドリーなビデオ多言語ダビングツールです。高度な音声認識と機械翻訳技術により、ビデオコンテンツを多言語に翻訳し、音声を同期させます。この ...

最新のAIリソース # AI音声合成 # AI翻訳 # AI音声合成

2年前

0161K

Kimi-Audio：オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。

1年前

0147.4K

Weights：声真似カバーソングと音声合成オーサリングプラットフォーム

はじめに Weightsは、簡単な操作でボイスカバー、音声合成、画像、音楽、動画を作成できる、AIを活用したクリエイティビティのためのソーシャルプラットフォームです。このプラットフォームは、ユーザーが素早く創作を始め、コミュニティと共有できるよう、豊富なツールやテンプレートを提供しています。

最新のAIリソース # AI音声合成 # AIボイスクローニング

1年前

0144.7K

Conch Speech (MiniMax Audio): 自然な音声を生成するAIツール

包括的な紹介 MiniMax AudioはMiniMax社のAI音声生成ツールで、テキストを類似度の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルに基づいており、音声合成の類似度は最大99...

最新のAIリソース # AI音声合成 # AIボイスクローニング

1年前

0144.3K

Kokoro TTS API：快速文本转语音的Docker化FastAPI封装（Kokoro-82M模型）

ココロTTS API: 高速音声合成のためのDocker化FastAPIラッパー (ココロ-82Mモデル)

概要 Kokoro-FastAPIは、Kokoro-82M音声合成モデルをサポートするために設計されたDockerベースのFastAPIラッパーです。このプロジェクトはNVIDIA GPUアクセラレーションをサポートし、キュー処理と自動スプライシングを提供します。

1年前

0140.2K

IndexTTS：中英ミキシング対応音声合成ツール

一般的な紹介 IndexTTSはGitHubでホストされているオープンソースの音声合成(TTS)ツールで、index-tsチームによって開発されています。XTTSとTortoiseの技術をベースに、モジュール設計を改良することで、効率的かつ...

1年前

0138.8K

Edge TTS Worker：使用Cloudflare部署微软语音合成API，兼容OpenAI 格式并封装Web界面

Edge TTS Worker: Cloudflare、OpenAI互換フォーマット、パッケージ化されたウェブインターフェースを使用したMicrosoft音声合成APIの展開

概要 Edge TTS Worker（edge-tsに依存）は、Microsoft Edge TTSサービスをOpenAI互換フォーマットでカプセル化し、Cloudflare Workerにデプロイされたプロキシサービスです。

1年前

0132.7K

edge-tts: 音声合成Pythonモジュール｜無料音声合成サービス

概要 edge-tsはオープンソースのPythonモジュールで、Microsoft EdgeブラウザやWindowsオペレーティングシステム、APIシークレットを必要とせずに、PythonコードでMicrosoft Edgeのオンライン音声合成サービスを利用することができます。

2年前

0122.6K

MLX-Audio: AppleのMLXフレームワークをベースにした音声合成ツール

概要 MLX-Audioは、AppleのMLXフレームワークをベースに開発されたオープンソースツールで、音声合成（TTS）と音声合成（STS）機能に重点を置いています。アップルシリコン（Mシリーズチップなど）のパワーを活用しています...

1年前

0117.4K

ココロ-ONNX：多言語・多音声をサポートする効率的な音声合成ツール

包括的な紹介ココロ-ONNXは、ONNXランタイムをベースとしたオープンソースの音声合成(TTS)ツールです。thewh1teagleによって開発されたこのプロジェクトは、効率的で高速な音声合成ソリューションを提供することを目的としています。

1年前

0117K

Ondoku: オンラインテキストリーダー|テキストから音声へ|画像から音声へリーダー

Ondoku 概要 Ondokuはオンライン音声合成ソフトウェアです。ユーザーがウェブサイトが提供するテキストボックスにテキストコンテンツを入力すると、ソフトウェアがユーザーのニーズに合わせて記事を音声読み上げに変換し、音声をMP3形式のファイルとして保存することができます。このサービスは、インスタントリスニングにも...

最新のAIリソース # AI音声合成

2年前

0111.5K

Orpheus-TTS：自然な中国語音声を生成する音声合成ツール

概論 Orpheus-TTSは、人間の自然な音声に近い音声を生成することを目標に、Llama-3bアーキテクチャで開発されたオープンソースの音声合成（TTS）システムです。Canopy AIチームによって開発され、英語、スペイン語、フランス語に対応しています。

1年前

0102.7K

GizAI：全能AI助手，集成主流生成式AI工具，让每个人免费使用商业化AI工具

GizAI：オールインワンのAIアシスタント、主流の生成AIツールを統合し、商用AIツールを誰でも無料で使えるようにする

はじめに GizAIは、AI生成、ノート作成、クラウドストレージ機能を統合したワンストッププラットフォームです。ユーザーは、GizAIで画像、動画、音声、テキスト、キャラクター、ストーリー、ゲームを生成し、プラットフォーム上で共同メモやクラウドストレージを取ることができます。

1年前

099.4K

ebook2audiobook：将电子书转换为有声读物，支持多语言和语音克隆的开源工具

ebook2audiobook: 電子書籍をオーディオブックに変換する、多言語サポートと音声クローンを持つオープンソースツール

一般的な紹介 ebook2audiobookは、強力なオープンソースの電子書籍からオーディオブックツールです。複数のフォーマットのeBookを、完全なチャプターマーカーとメタデータ付きのオーディオブックに変換することができます。このツールは、電子書籍フォーマットの変換にCo...

1年前

098.7K

AivisSpeech：情緒豊かな日本語音声合成ソフトウェアの開発

概要 AivisSpeechはVOICEVOXエディタのUIをベースにした日本語音声合成ソフトウェアです。AivisSpeech Engineを統合し、感情豊かな音声を簡単に生成することができます。

最新のAIリソース # AI音声合成

2年前

095.9K

AnyVoice: 無料オンラインボイスクローニング！

概論 AnyVoiceは高度なAI音声生成プラットフォームであり、超リアルな音声生成と音声クローンサービスを提供します。ユーザーはテキストを自然な音声に変換し、数百のプリセット音声から選択することができます。適切な音声が見つからない場合は、...

最新のAIリソース # AI音声合成 # AIボイスクローニング

1年前

094.2K

EmotiVoice：マルチボイスおよび感情キューイングコントロール付き音声合成エンジン

総合紹介 EmotiVoiceは、NetEaseYoudaoによって開発された、複数の音声と感情キュー制御を備えた音声合成（TTS）エンジンです。このオープンソースのTTSエンジンは、英語と中国語をサポートし、2000以上の異なる音声を持ち、感情合成機能を持ち、幸せな音声を作成することができます。

最新のAIリソース # AI音声合成

1年前

094.1K

Vidnoz AI：たった1枚の写真でデジタル人語動画を生成、複数の無料動画生成ツール

概要説明 Vidnozは、1分以内に素早くAIビデオを作成するための無料のAIビデオ生成プラットフォームです。費用、ダウンロード、経験は必要ありません。このプラットフォームは、500以上のAIアバター、470以上のリアルなAIナレーション、500以上のテンプレートを提供しています。VidnozのAIビデオ...

2年前

093.9K

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。

一般的な紹介 OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成（TTS）APIを提供するオープンソースプロジェクトです。このプロジェクトでは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質な音声合成を行うことができます。

1年前

093.8K

ViiTor AI：音声・映像の多言語翻訳合成と音声クローン作成サービス

総合紹介 ViiTor AIは、高品質な動画翻訳、ボイスクローン、AI生成アバター動画、音声合成サービスの提供に特化した強力な人工知能プラットフォームです。このプラットフォームは多言語をサポートし、ユーザーが簡単に多言語コンテンツ作成を実現できることを目指しています。

1年前

092.3K

テンセント・スマート・シャドウ：インテリジェント動画作成ツール｜AIデジタルマン、アニメ生成キット

総合紹介 Tencent Smart Shadowは、テンセントが開始したオンラインインテリジェント動画作成プラットフォームで、クラウドサービスによって提供される強力なAIツールにより、テキストダビング、デジタル人力放送、自動字幕認識などの機能をサポートします。

2年前

092.3K

pyvideotrans：動画翻訳ダビングツール

pyVideoTrans 概要 pyvideotransはビデオ翻訳ダビングツールです。ユーザーはビデオコンテンツをある言語から別の言語に翻訳し、ビデオに適切な吹き替えと字幕を追加することができます。このツールはopenai-whisper offline...をベースにしています。

2年前

091.4K

ココロWebGPU: ブラウザのオフライン操作のための音声合成サービス

はじめにココロWebGPUは、WebMLコミュニティがHugging Faceプラットフォーム上で提供するココロ音声合成（TTS）モデルのWebGPUバージョンです。このプロジェクトは、WebGPUの技術を利用し、ユーザーが...

1年前

091K

OuteTTS: 実験的音声合成モデル、純粋な言語モデリングアプローチで実装されたTTS

包括的な紹介 OuteTTSは、純粋な言語モデリングアプローチを用いて高品質の音声を生成する、実験的な音声合成（TTS）モデルです。従来のTTSシステムとは異なり、OuteTTSは外部アダプターや複雑なアーキテクチャを必要としません。このモデルは、LLaMaアーキテクチャに基づいています。

1年前

086.1K

Llasa 1~8B: 高品質音声生成とクローニングのためのオープンソース音声合成モデル

概要 Llasa-3Bは、香港科学技術大学オーディオ研究室（HKUST Audio）が開発したオープンソースの音声合成（TTS）モデルです。このモデルはLlama 3.2Bアーキテクチャに基づいており、複数の音声合成をサポートするだけでなく、高品質な音声合成を提供するために慎重に調整されています。

1年前

085.7K

Dia：超リアルな多人数対話生成のための音声合成モデル

一般的な紹介 Diaは、Nari Labsによって開発されたオープンソースのテキスト音声合成（TTS）モデルで、超リアルなダイアログ音声を生成することに重点を置いています。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、さらに非言語表現も生成します。

1年前

084.1K

Hume AI：赋予AI情感识别能力|从声音和表情识别情感状态|生成具有情感状态的语音

Hume AI: 感情認識でAIを強化する｜音と表情から感情を認識する｜感情のある音声を生成する

概論ヒュームAIは感情知能に特化したAI企業で、人間の感情を理解し反応するマルチモーダルAI技術を開発している。同社の主力製品であるEmpathic Voice Interface（EVI）は、ユーザーの感情を認識し、それに応答することができる。

最新のAIリソース # AIオープンサービス # AI音声合成

2年前

082.5K

Spark-TTS：自然な音声を生成する音声合成ツール

概要 Spark-TTSは、SparkAudioチームによって開発され、GitHubでホストされているオープンソースの音声合成（TTS）ツールで、ユーザーがテキストを自然で滑らかな音声に効率的に変換できるように設計されています。

1年前

081.6K

Vapi：開発者が低遅延の音声アシスタントを迅速に構築できるようにする

包括的な紹介 Vapiは開発者向けの音声AIプラットフォームです。Vapiは、リアルタイムの会話、電...

最新のAIリソース # AIオープンサービス # AI音声合成

1年前

081.1K

こころ：自然で滑らかな音声を生成する効率的な音声合成モデル

一般的な紹介ココロ82MはHugging Faceが提供する効率的な音声合成モデルで、より少ないパラメータとデータで高品質な音声を生成するように設計されています。このモデルは8,200万個のパラメータを持ち、Apache 2.0の下でライセンスされています。

1年前

080.5K

Muyan-TTS：パーソナライズされたポッドキャストの音声トレーニングと合成

Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成（TTS）モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3...をベースにしています。

1年前

080.5K

TTSMaker：無料オンライン音声合成ツール

概要 TTSMakerは、100以上の言語と300以上の音声スタイルをサポートする無料のオンライン音声合成ツールです。ユーザーは、テキストを自然で滑らかな音声に変換し、商用利用のために音声ファイルをダウンロードすることができます。このツールは、ビデオのダビング、オーディオブック、教育やトレーニングに適しています。

最新のAIリソース # AI音声合成

2年前

078.4K

MegaTTS3：中国語音声と英語音声を合成する軽量モデル

包括的な紹介 MegaTTS3は、ByteDanceが浙江大学と共同で開発したオープンソースの音声合成ツールで、高品質な中国語と英語の音声を生成することに重点を置いています。MegaTTS3のコアモデルは、わずか0.45Bパラメータで、軽量かつ効率的です。このプロジェクトは ...

1年前

077.8K

ChatTTS：実際の人の話し声を模倣した音声生成モデル（ChatTTSワンクリックアクセラレーションパッケージ）

一般的な紹介 ChatTTSは対話シナリオ用に設計された生成音声モデルです。自然で表現力豊かな音声を生成し、多言語、複数話者をサポートし、対話型ダイアログに適しています。このモデルは、笑い、ポーズ、間投詞のようなきめ細かなリズムの特徴を予測し、制御することで、対話に適した音声を生成します。

1年前

077.6K

FreeTTS：無料オンライン音声合成ツール|オーディオエンハンスメント|オーディオクリップ

FreeTTS 概要 FreeTTSは、テキストを自然な音声ファイルに変換できる無料のオンライン音声合成ツールです。複数の言語とサウンドオプションをサポートし、ユーザーはテキストをMP3、WAV、OGG、ACC形式に変換することができます...

2年前

077.1K

マジック・ボイス・ワークショップ：プロフェッショナル・ボイスオーバー＆ショートビデオ・ナレーション作成プラットフォーム｜リアル・パーソン・ボイスオーバー｜クローン・ボイス｜ワンクリックで映像化

総合紹介マジックボイス工房は、ソフトウェアアフレコ、リアルアフレコ、サウンドライブラリ、クローンサービスなどの情報をワンストップで提供するショートビデオ・AIアフレコプラットフォームです。このプラットフォームは、音声編集、AIコピー生成、ビデオ編集、音声関連サービスやコンテンツ制作のためのコラボレーションツールを統合しています。ユーザーはオーディオ編集を体験...

2年前

076.3K

Record Cafe: ワンストップ音声・映像処理プラットフォーム|動画生成|AI字幕|音声抽出|音声テキスト化

総合紹介 Record Cafeはワンストップの音声/動画処理プラットフォームで、AI動画対話、AI字幕、AI音声テキスト化サービスを提供する。画面録画、動画編集、GIF/音声変換などの機能があり、クラウドストレージや共有もサポートします。インターフェースは直感的で使いやすく、マルチスクリーン録画と多言語スマートフォンにも対応しています。

2年前

076.3K

ティザーアフレコ：短編映像のナレーションと制作に特化したインテリジェントアフレコツール

総合紹介 Tease Dubbingは500万人以上のユーザーを持つ人気のAIダビングソフトです。このソフトは先進的なAI知能ダビング技術を使って、プロでリアルなダビング効果を提供し、ショートビデオ、広告制作、教育訓練などのシーンに適しています。Teaser Dubbingは、ユーザーに迅速な...

最新のAIリソース # AI音声合成 # AIオーディオ／ビデオ・エディター

2年前

075.4K

YouTube Dubbing：实时将YouTube视频翻译为不同语言并同步配音

YouTubeダビング：YouTubeの動画をさまざまな言語に翻訳し、リアルタイムでダビングを同期させます。

概要 YouTube Dubbingは、動画クリエイターと視聴者に多言語吹き替えサービスを提供するために設計されたインテリジェントな吹き替えプラットフォームです。AI技術により、YouTube動画を自動的に翻訳し、吹き替え音声を生成します。ユーザーがインストールする必要があるのは...

最新のAIリソース # AI音声合成

2年前

074.7K

Parler-TTS: 入力テキストから話者固有の音声合成モデルを生成する

一般的な紹介 Parler-TTSは、Hugging Face社によって開発されたオープンソースの音声合成（TTS）モデルライブラリで、高品質で自然な音声を生成するように設計されています。このモデルは、特定の話者スタイル（性別、ピッチ、話し方など）の入力テキストに基づいて音声を生成することができます。

1年前

074.6K

Memo AI: 動画から字幕へのネイティブクライアント、多言語字幕の変換

概要 MemoAIは、ビデオやオーディオファイルをテキスト、字幕、メモに変換するために設計された強力なビデオ翻訳ツールです。YouTubeの動画でも、ポッドキャストでも、ローカルファイルでも、MemoAIは簡単に扱うことができます。中国語、英語、日本語など90以上の言語に対応しています。

2年前

074.5K

説明: ワンストップでビデオやポッドキャストを編集。

Descript 一般的な説明 Descriptは、パワフルでありながら使いやすいビデオおよびポッドキャスト編集ツールです。業界トップクラスの書き起こし精度とスピード、強力な修正ツールに加え、AI技術で動画をテキストに書き起こしたり、テキストを編集して動画を編集する機能も備えています。さらに...

最新のAIリソース # AI音声合成 # AIオーディオ／ビデオ・エディター

2年前

073.5K

XAudioPro: プロフェッショナルオンラインオーディオ編集ツール|オーディオブック制作|テキストからスピーチへ|伴奏分離

概要 XAudioProは、プロフェッショナルかつポータブルな先進的なオンラインオーディオリアルタイム編集およびトランスコードツールです。カット、クロップ、コピー、削除、復元、振幅ゲインコントロールなどのプロフェッショナルなオーディオ編集機能をサポートします。また、スペクトルサブトラクションノイズ除去、ローパスノイズ除去などのノイズ除去サービスも提供します。

最新のAIリソース # AI音声合成 # AIオーディオ／ビデオ・エディター

2年前

073.5K

Orate：よく知られた音声生成、音声トランスクリプション、音声モデリングを統合する統一API

概要 Orateは、音声生成と文字起こしに特化したAIツールキットです。Orateは、OpenAI、ElevenLabs、AssemblyAIなどの主要なAIプロバイダーとシームレスに統合する統一APIを提供し、ユーザーが強制的に音声を作成できるようにします。

1年前

073K

Audiblez: ココロでオーディオブックを作成、電子書籍をオーディオブックに変換

概要 Audiblezは、電子書籍（.epub形式など）をオーディオブック（.m4b形式など）に変換するためのオープンソースプロジェクトです。Kokoroの高品質音声合成技術を利用し、多言語・多音声をサポートしています。ユーザーは単純に...

1年前

072.5K

Easy Voice Toolkit: 地域展開のためのAI音声ツールキット

包括的な紹介 Easy-Voice-ToolkitはOpen Source Speech Projectに基づく多機能なツールキットで、音声認識、音声トランスクリプション、音声変換、データセット作成、モデルトレーニングのための幅広い自動音声ツールを提供します。ユーザーは、必要に応じてこれらのツールを選択的に使用することができます...

2年前

071.8K

PlayAI：スムーズで感情的な音声対話と音声合成サービスの提供（英語）

概論 PlayAIは、音声生成と音声クローニングに特化したAIプラットフォームである。スムーズで感情的なダイアログを生成できる幅広い音声モデルを提供しています。ユーザーはこのプラットフォームを使って、対話体験を向上させるパーソナライズされた音声エージェントを作成することができます。

最新のAIリソース # AI音声合成

2年前

071.5K

サウンドクリッピング：ヒマラヤの自然な人の声、マルチナレーター音声作成プラットフォーム

包括的な紹介 Himalaya Audio Editorは包括的なAIオーディオ作成プラットフォームです。プロ級のポッドキャスト制作、マルチトラックレコーディング、オーディオ編集、テキストを音声に変換する機能など、ユーザーをサポートする強力な機能を提供します。また、このプラットフォームにはプロフェッショナルな音声のための複数のオプションが含まれており、ユーザーをサポートします...

最新のAIリソース # AI音声合成 # AIオーディオ／ビデオ・エディター

2年前

070.6K

csm-mlx: Appleデバイス用csm音声生成モデル

包括的な紹介 csm-mlxはAppleが開発したMLXフレームワークをベースにしており、特にApple Silicon (Apple Silicon) CSM (Conversation Speech Model)音声対話モデル用に最適化されています。このプロジェクトにより、...

1年前

070.4K

Jellypod: 多言語AIポッドキャストの制作、AIポッドキャストの作成、編集、配信

概要 Jellypodは、ユーザーが簡単に高品質のAIポッドキャストを作成、編集、公開できるように設計された強力なAIポッドキャストスタジオです。Jellypodを使用すると、ユーザーは、パーソナライズされたポッドキャストホストを設計し、スクリプトを洗練させ、ポッドキャストを公開することができます。

最新のAIリソース # AI音声合成

1年前

070.3K

PDF2Audio: PDFから音声への変換ツール、PDFからポッドキャストへ

概要 PDF2Audioは、PDFファイルをポッドキャスト、講義、要約などの音声コンテンツに変換するために設計されたオープンソースプロジェクトです。このツールは、テキスト生成とテキスト音声変換にOpenAIのGPTモデルを活用しており、ユーザは複数のPDFファイルをアップロードすることができます。

最新のAIリソース # AI音声合成

2年前

070K

Listnr: 多言語AIスピーチジェネレーター、革新的な人間の音声合成技術

一般的な紹介 Listnrは、142以上の言語、1,000以上の異なる声で音声合成を作成するジェネレーティブAIエンジンを搭載した音声合成ソフトウェアです。このプラットフォームは、ショートビデオ、YouTub...

最新のAIリソース # AI音声合成 # AIボイスクローニング

2年前

069.9K

NotebookLM：知識ノート検索読書、マルチクラス文書生成音声対話ポッドキャスト

はじめに NotebookLMは、Googleが提供するパーソナライズされたAIコラボレーションツールで、ユーザーの頭脳を最大限に活用できるように設計されている。ユーザーがドキュメントをアップロードすると、NotebookLMは即座にこれらのソースからコンテンツをマスターし、ユーザーが簡単に読めるようにします。

最新のAIリソース # AI教育ツール # AI音声合成 # AIノート

1年前

069.3K

イレブンラボMCP：スピーチジェネレーションMCPサービス

概論 ElevenLabs MCPはGitHubでホストされているElevenLabsの公式オープンソースプロジェクトです。モデル・コントロール・プロトコル（Model Context Protocol, MCP）に基づいたサービスです。

最新のAIリソース # AI音声合成 # MCPサービス

1年前

068.8K

Open NotebookLM: PDFをオープンソースツールのポッドキャストに変換する

概要 Open NotebookLMは、あらゆるPDF文書をポッドキャストに変換するために設計されたオープンソースプロジェクトです。このツールは、オープンソースのLarge Language Model (LLM)とText-to-Speech (TTS)モデルを使用してPDFコンテンツを処理し、オーディオポッドキャストに適した自然なダイアログを生成します...

1年前

067.9K

イレブンラボ：高品質AI音声生成プラットフォーム、テキストダビング、音声クローニングツール

はじめにイレブンラボは、米国ニューヨークに拠点を置く、ジェネレーティブAIスピーチの分野に特化した新興企業である。同社は、テキスト生成音声、スピーチ生成音声、音声クローン、音声認識のための強力なサービスを提供しています。

最新のAIリソース # AI音声合成 # AIボイスクローニング

2年前

067.8K

Uberduck: AIがラップと音声を生成するプラットフォーム｜Text to Speech｜テキスト・トゥ・スピーチ

概要 Uberduck AIは、クリエイティブ・エージェンシー、音楽プロデューサー、プログラマー向けに、歌声や話し声のAI合成を提供する革新的なプラットフォームです。ユーザーは、さまざまな音楽のリズムを選択し、AIを使って歌詞を生成したり、自分で書いたり、特定のサウンドを選択して、最終的にラップソングを作成することができます...

2年前

067.7K

IMS Toucan: 高速でコントロール可能な多言語（7000以上の言語に対応）音声合成ツール

一般的な紹介 IMS Toucanはドイツのシュトゥットガルト大学の自然言語処理研究所(IMS)によって開発された最先端の音声合成(TTS)ツールキットです。このツールキットは7000以上の言語をサポートし、高速で、制御可能で、必要な計算資源が少ない。

1年前

066.9K

複数の高度な音声合成サービスを統合したオープンソース運用プロジェクト

概要 Open-VoiceCanvasは、ItusiAIチームによって開発されたオープンソースの音声合成プラットフォームです。50以上の言語をサポートし、テキストを自然な音声に変換したり、音声をアップロードすることでパーソナライズされた音声をクローンすることができます。このプロジェクトはOpe...

1年前

066.9K

Autiobooks: epub電子書籍をm4bオーディオブックに変換する

概要 Autiobooksは、.epub形式のeBookを.m4b形式のオーディオブックに素早く変換するためのオープンソースツールです。自然で滑らかな音声を生成するために、Kokoroが提供する高品質の音声合成技術を使用しています。このツールは...

1年前

066.5K

キャット＆スター：お子様と一緒に専用の童話を書くための物語リスニングアプリ

総論 "猫と星"（maoyuxing.com）は、子供のために設計されたインタラクティブな物語作成プラットフォームであり、モバイルアプリケーションを通じて、親子が一緒にパーソナライズされたおとぎ話を作成するのに役立ちます。ユーザーは、子供の名前や好みなどの情報を入力することで、ユニークな物語コンテンツを作成することができる。

最新のAIリソース # AI教育ツール # AI音声合成

1年前

066.3K

Podcastfy：多源内容转多语言音频对话工具，NotebookLM 播客功能的开源替代方案

Podcastfy：NotebookLMのポッドキャスティング機能に代わるオープンソースの多言語音声会話ツール、マルチソースコンテンツ

一般的な紹介 PodcastfyはオープンソースのPythonパッケージで、生成人工知能（GenAI）技術を使用して、ウェブコンテンツ、PDFファイル、テキスト、画像、YouTube動画、その他多くのソースを魅力的な多言語に変換します。

2年前

066.1K

Resemble AI：人工知能音声合成プラットフォーム｜ボイスクローン｜ディープフェイクオーディオ検出

総合紹介リセンブルAIは、企業向けに設計された人工知能音声合成プラットフォームです。このプラットフォームは、最先端のAI音声生成技術と、将来の情報セキュリティのためのディープフェイクオーディオ検出を提供します。特徴として、音声クローニング、リアルタイムな偽造音声検出、AI透かし技術...

最新のAIリソース # AI音声合成 # AIボイスクローニング

2年前

065.9K

PlayHT：超リアルな音声を生成するAIツール

概要 PlayHTは、AI音声生成に特化した効率的なオンラインプラットフォームで、ユーザーがテキストを自然でリアルな音声に素早く変換できるよう支援します。60以上の言語と多様なアクセントをサポートする600以上のAI音声を提供し、ポッドキャスト制作、教育コンテンツ、マーケティングプロモーション...

最新のAIリソース # AI音声合成 # AIボイスクローニング

1年前

065.7K

Murf AI: ボイスチェンジャー|音声テキスト|テキストから音声へ|音声エディター

一般的な紹介 Murf AIは、テキストを人間に近い音声に変換する、強力なオンライン人工知能音声生成ツールです。最大120以上のAI音声オプションを提供し、20以上の言語をサポートし、ポッドキャスト、ビデオ、プロのプレゼンテーションなど様々な状況に適しています。

最新のAIリソース # AI音声合成 # AI音声合成

2年前

065.3K

Text2Voice：シリコンベースのフローAPIに基づく音声合成グラフィカルインターフェース

一般的な紹介 Text2Voiceは、シリコンベースのモビリティAPIに基づいた音声合成機能を提供するオープンソースツールで、クリーンなグラフィカル・ユーザー・インターフェース（GUI）が最大の特徴である。開発者のシェルドン・リーがGitHubで作成したもので、...

1年前

065.1K

NVIDIA PDF to Podcast：设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast：プロンプトの誘導語を設定してPDFをポッドキャストに変換するAIツール

概論 NVIDIA AI Blueprint: PDF to Podcastは、NVIDIAが開発したオープンソースプロジェクトで、PDFドキュメントを魅力的なオーディオコンテンツに変換します。このプロジェクトは、NVIDIA NIM (NVIDIA AI Blueprint) を活用しています。

AIニュース # AI Java オープンソースプロジェクト # AI音声合成

1年前

065K

Podcastle：高品質のポッドキャストを素早く作成するAIツール

概要 Podcastleは、AIベースのオンラインプラットフォームで、ユーザーが高品質なポッドキャストを素早く作成・編集できるよう支援することに特化しています。録音、編集、公開の機能が統合されており、ユーザーは特別な機器や複雑なソフトウェアを必要とせず、すべてブラウザから行うことができる。このプラットフォームが利用するのは...

最新のAIリソース # AI音声合成 # AIオーディオ／ビデオ・エディター

1年前

063.7K

DupDub：AI搭載ビデオエディター｜ダビング｜ビデオ翻訳｜フォトデジタイザー

概要 Dupdubは、ユーザーの創造性をサポートする様々なAIツールを提供する、サイドヘビーポッドキャストおよびビデオプレゼンテーション作成プラットフォームです。テキストからビデオへの作成、AIによる音声やビデオの吹き替えサービス、ビデオ編集、文字起こし、字幕作成などの機能を備えています。また、Dupdubは...

最新のAIリソース # AIデジタルマン # AI音声合成 # AI音声合成

2年前

063.5K

Azure TTS Importer：音声合成サービスを読み上げソフトウェアに統合する

包括的な紹介 TTS Importerは、Azure TTS（Text-to-Speech）音声合成サービスを様々な読み上げソフトに簡単にインポートできるように設計されたオープンソースプロジェクトです。このツールは、Read（legado...）を含むいくつかの一般的な読み上げソフトウェアをサポートしています。

1年前

062.9K

Acoust: オンラインAI音声生成・音声合成（TTS）サービスプラットフォーム

概要 Acoustは、最新のAI技術を駆使してリアルな音声を生成する、オンラインAI音声生成・音声合成（TTS）サービスプラットフォームです。また、強力なビデオ編集ツールも提供しており、ユーザーは複数のソフトウェアを使用することなくビデオ制作を完了することができます。

最新のAIリソース # AI音声合成 # AI音声合成

1年前

061.9K

Audibit：人気の技術記事をすぐに聴ける音声ポッドキャストにする

一般的な紹介 Audibitはオープンソースプロジェクトで、主な機能は、ハッカーニュース、TechCrunchや他の人気のある技術記事を自動的にオーディオポッドキャストに変換することです。このプロジェクトは...

1年前

061.3K

Wondercraft: 広告のボイスオーバー、マルチプレイヤー・オーディオブック、ポッドキャストに特化したテキスト音声化ツール

概要ワンダークラフトは、コンテンツ制作者に音声・映像制作のためのワンストップ・ソリューションを提供する、AIを活用した画期的な音声・映像制作プラットフォームです。高度なAI技術により、テキストコンテンツを自然で滑らかな音声に変換し、20以上の言語に対応します。

最新のAIリソース # AI音声合成

1年前

060K

海藻AI：インテリジェント音声合成と音声クローニング・プラットフォーム

総合紹介 Seaweed AIは、Yun Zhisheng AIオープンプラットフォームを搭載した、オンラインでテキストを音声に変換できるインテリジェントなダビング製品です。ユーザー自身が音声クローンを作成し、性別、アクセント、言語の異なるAI発音者を提供し、テキスト入力後に直接音声をダビングすることができます。また、テキストを入力した後、直接音声をダビングすることもできます。

最新のAIリソース # AI音声合成 # AIボイスクローニング

2年前

060K

QuickPiperAudiobook：一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook:自然な音質のオーディオブックを作成する鍵。

総合紹介 QuickPiperAudiobookは、様々なテキスト形式（epub、mobi、txt、PDF、HTMLなど）を、簡単なコマンド1つで自然な音声のオーディオブックに変換するために設計されたオープンソースプロジェクトです。このツールはPi...

2年前

059.4K

PodLM：ダイアログ、ウェブページ、長文の多言語オーディオポッドキャストを生成（有料）

PodLMの概要 PodLMは、ユーザーがテキスト、ドキュメント、URLコンテンツを高品質のポッドキャスト音声に素早く変換できるように設計された、最先端のAIポッドキャスト生成プラットフォームです。最先端のAI技術を活用することで、PodLMは構造化された魅力的なポッドキャスト・スクリプトを自動生成することができます。

最新のAIリソース # AI音声合成

2年前

056.9K