
Acoust: オンラインAI音声生成・音声合成(TTS)サービスプラットフォーム
Acoustは、最新のAI技術を使ってリアルな音声を生成するオンラインAI音声生成・音声合成(TTS)サービスプラットフォームです。このプラットフォームはまた、ユーザーが複数のソフトウェアを使用することなくビデオを作成できる強力なビデオ編集ツールも提供しています。
Acoustは、最新のAI技術を使ってリアルな音声を生成するオンラインAI音声生成・音声合成(TTS)サービスプラットフォームです。このプラットフォームはまた、ユーザーが複数のソフトウェアを使用することなくビデオを作成できる強力なビデオ編集ツールも提供しています。
包括的な紹介 Kokoro-FastAPIは、Kokoro-82M音声合成モデルのサポートを提供するために設計されたDockerベースのFastAPIパッケージです。このプロジェクトはNVIDIA GPUアクセラレーションをサポートし、生の成長したテキストの音声出力をより効率的で首尾一貫したものにするためのキュー処理と自動スプライシングを提供します。このプロジェクトは ...
ビルダーインテリジェントプログラミングモード、DeepSeek-R1とDeepSeek-V3の無制限の使用、海外版よりも滑らかな経験を有効にします。ただ、中国語のコマンドを入力し、プログラミングの知識はまた、独自のアプリケーションを書くためにゼロしきい値をすることはできません。
一般的な紹介 ココロ82MはHugging Faceが提供する効率的な音声合成モデルで、少ないパラメータとデータで高品質な音声を生成するように設計されています。このモデルは8,200万個のパラメータを持ち、Apache 2.0ライセンスの下で配布され、幅広い音声パック(Voicepacks)をサポートしています。
一般的な紹介 ebook2audiobookは、強力なオープンソースの電子書籍からオーディオブックツールです。複数の形式の電子書籍を、完全なチャプターマーカーとメタデータ付きのオーディオブックに変換することができます。このツールは、電子書籍フォーマットの変換にCalibreを使用し、オーディオブックへの変換にCoquiのXTTSv2とFairseqを使用しています。
概要 Edge TTS Worker(depends on edge-tts )は、Microsoft Edge TTSサービスをOpenAIフォーマットと互換性のあるAPIインターフェースにカプセル化する、Cloudflare Worker上にデプロイされたプロキシサービスです。このプロジェクトにより、ユーザはMicrosoftの認証なしで簡単に利用することができます。
総合紹介 ViiTor AIは、高品質な動画翻訳、音声クローン、AI生成アバター動画、音声合成サービスの提供に特化した強力な人工知能プラットフォームです。このプラットフォームは多言語をサポートし、ユーザーが簡単に多言語コンテンツ作成を実現できるように設計されています。ViiTor AIの動画翻訳...
総合紹介 ワンダークラフトは、コンテンツクリエイターにワンストップのオーディオ/ビデオ制作ソリューションを提供する、AIを活用した画期的なオーディオ/ビデオ制作プラットフォームです。このプラットフォームは、高度なAI技術を使用してテキストコンテンツを自然で滑らかな音声に変換し、20以上の言語をサポートし、200以上のAI...
概要 NotebookLM Podcastは、人工知能技術を活用して、あらゆるテキストコンテンツをダイナミックで魅力的なオーディオポッドキャストに変換する革新的なプラットフォームです。NotebookLMポッドキャストは、学生、教育者、コンテンツ制作者、多忙なプロフェッショナルなど、どのような方にもパーソナライズされた...
概要 AivisSpeechは、VOICEVOXエディタUIをベースとした日本語音声合成ソフトウェアです。AivisSpeech Engineを統合しており、感情豊かな音声を簡単に生成することができます。AivisSpeechは幅広い音声合成モデルをサポートしており、高品質な音声を生成することができます。
概論 PlayAIは音声生成と音声クローニングに特化したAIプラットフォームである。スムーズで感情的なダイアログを生成できる幅広い音声モデルを提供しています。PlayAIの技術は、様々なアプリケーションに適しています。
はじめに GizAIは、AI生成、ノート作成、クラウドストレージ機能を統合したワンストッププラットフォームです。ユーザーはGizAIで画像、動画、音声、テキスト、キャラクター、ストーリー、ゲームを生成し、プラットフォーム上で共同メモやクラウドストレージを利用することができます。GizAIは幅広いAIツールを提供し、利用を支援します。
包括的な紹介 OuteTTSは、純粋な言語モデリングアプローチを用いて高品質の音声を生成する、実験的な音声合成(TTS)モデルです。従来のTTSシステムとは異なり、OuteTTSは外部アダプターや複雑なアーキテクチャを必要としません。このモデルはLLaMaアーキテクチャをベースにしており、音声クローン機能をサポートしています。
PodLMの概要 PodLMは最先端のAIポッドキャスト生成プラットフォームで、ユーザーがテキスト、文書、URLコンテンツを高品質のポッドキャスト音声にすばやく変換できるように設計されています。最先端のAI技術を活用することで、PodLMは構造化された魅力的なポッドキャストスクリプトを自動的に生成し、プロフェッショナルな品質のポッドキャストオーディオに変換することができます。
概要 SoniTranslate はパワフルでユーザーフレンドリーなビデオ多言語ダビングツールです。高度な音声認識と機械翻訳技術により、ビデオコンテンツを多言語に翻訳し、音声を同期させます。このプロジェクトは、Gradi...
総合紹介 Tease Dubbingは500万人以上のユーザーを持つ人気のAIダビングソフトです。先進的なAIインテリジェントダビング技術を採用し、プロフェッショナルでリアルなダビング効果を提供し、ショートビデオ、広告制作、教育訓練などのシーンに適しています。Teaser Dubbingは、ユーザーに迅速かつ便利な...
概要 YouTube Dubbingは、動画クリエイターと視聴者に多言語吹き替えサービスを提供するために設計されたインテリジェントな吹き替えプラットフォームです。AI技術により、YouTube動画を自動的に翻訳し、吹き替え音声を生成します。ユーザーはプラグインをインストールするだけで、動画を見ることができる。
一般的な紹介 PodcastfyはオープンソースのPythonパッケージで、生成人工知能(GenAI)技術を使って、ウェブコンテンツ、PDFファイル、テキスト、画像、youtube動画、その他多くのソースを魅力的な多言語音声ダイアログに変換します。従来のユーザーインターフェイスベースのものとは異なり...
総合案内 QuickPiperAudiobookは、さまざまなテキスト形式(epub、mobi、txt、PDF、HTMLなど)を、1つの簡単なコマンドで自然な音声のオーディオブックに変換するために設計されたオープンソースプロジェクトです。このツールは、変換にPiperモデルを使用し、Piperのインストールとph...
概要 PDF2Audioは、PDFファイルをポッドキャスト、講義、要約などの音声コンテンツに変換するために設計されたオープンソースプロジェクトです。このツールは、テキスト生成と音声合成にOpenAIのGPTモデルを利用しており、ユーザーは複数のPDFファイルをアップロードし、異なる指示テンプレート(例えば、ポッドキャスト...