AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
全75記事

タグ: 音声合成AIテキスト 2ページ目

Orate:集成知名语音生成、语音转录与变声模型的统一API-首席AI分享圈

Orate:よく知られた音声生成、音声トランスクリプション、音声モデリングを統合する統一API

概要 Orateは音声生成と文字起こしに特化したAIツールキットです。Orateは、OpenAI、ElevenLabs、AssemblyAIなどの主要なAIプロバイダーとシームレスに統合する統一APIを提供し、ユーザーがリアルで人間のような音声を作成したり、音声をテキストに書き起こしたりするのを支援します。

Weights:模仿声音翻唱歌曲和文本转语音的创作平台-首席AI分享圈

Weights:声真似カバーソングと音声合成オーサリングプラットフォーム

はじめに Weightsは、簡単な操作でボイスカバー、音声合成、画像、音楽、動画を作成できる、AIを活用したクリエイティビティのためのソーシャル・プラットフォームです。このプラットフォームは、ユーザーが素早く創作を始め、コミュニティで作品を共有できるよう、豊富なツールとテンプレートを提供している。

Open NotebookLM:将PDF转换为播客的开源工具-首席AI分享圈

Open NotebookLM: PDFをオープンソースツールのポッドキャストに変換する

概論 Open NotebookLMは、あらゆるPDF文書をポッドキャストに変換するために設計されたオープンソースプロジェクトです。このツールは、オープンソースのLarge Language Model (LLM)とText-to-Speech (TTS)モデルを使用してPDFコンテンツを処理し、オーディオポッドキャストに適した自然なダイアログを生成し、MP3ファイルに出力します。このプロジェクトはN...

Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型-首席AI分享圈

Llasa 1~8B: 高品質音声生成とクローニングのためのオープンソース音声合成モデル

概要 Llasa-3Bは、香港科学技術大学オーディオ研究室(HKUST Audio)が開発したオープンソースの音声合成(TTS)モデルです。このモデルはLlama 3.2Bアーキテクチャをベースとしており、多言語に対応するだけでなく、感情表現や個性を表現できる高品質な音声生成を実現するために、入念なチューニングが施されています。

OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式-首席AI分享圈

OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。

一般的な紹介 OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成(TTS)APIを提供するオープンソースプロジェクトです。このプロジェクトは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質の音声出力を生成できるようにします。

Jellypod:制作多语言AI播客,创建、编辑和分发AI播客-首席AI分享圈

Jellypod: 多言語AIポッドキャストの制作、AIポッドキャストの作成、編集、配信

概要 Jellypodは、ユーザーが簡単に高品質のAIポッドキャストを作成、編集、公開できるように設計された強力なAIポッドキャストスタジオです。Jellypodを使えば、ユーザはパーソナライズされたポッドキャストホストをデザインし、スクリプトを洗練させ、ポッドキャストをSpotify、YouTube、Apple P...に公開することができます。

Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成-首席AI分享圈

Sherpa-ONNX: ONNXRuntimeによるオフライン音声認識と合成

概要 sherpa-onnxは、Next-gen Kaldiチームによって開発されたオープンソースプロジェクトで、効率的なオフライン音声認識および音声合成ソリューションを提供します。Android、iOS、Raspberry Piなど様々なプラットフォームに対応し、ネットワーク接続がない環境でもリアルタイムに音声認識・音声合成を行うことができます。

Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物-首席AI分享圈

Audiblez: ココロでオーディオブックを作成、電子書籍をオーディオブックに変換

概要 Audiblezは、電子書籍(.epub形式など)をオーディオブック(.m4b形式など)に変換するためのオープンソースプロジェクトです。このプロジェクトでは、Kokoroの高品質音声合成技術を利用して、複数の言語と音声をサポートしています。ユーザーは、簡単なコマンドラインで電子ブックを変換できます。

Acoust:在线AI语音生成和文本转语音(TTS)服务平台-首席AI分享圈

Acoust: オンラインAI音声生成・音声合成(TTS)サービスプラットフォーム

Acoustは、最新のAI技術を使ってリアルな音声を生成するオンラインAI音声生成・音声合成(TTS)サービスプラットフォームです。このプラットフォームはまた、ユーザーが複数のソフトウェアを使用することなくビデオを作成できる強力なビデオ編集ツールも提供しています。

Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)-首席AI分享圈

ココロTTS API: 高速音声合成のためのDocker化FastAPIラッパー (ココロ-82Mモデル)

包括的な紹介 Kokoro-FastAPIは、Kokoro-82M音声合成モデルのサポートを提供するために設計されたDockerベースのFastAPIパッケージです。このプロジェクトはNVIDIA GPUアクセラレーションをサポートし、生の成長したテキストの音声出力をより効率的で首尾一貫したものにするためのキュー処理と自動スプライシングを提供します。このプロジェクトは ...

Kokoro:高效语音合成模型,生成自然流畅的语音-首席AI分享圈

こころ:自然で滑らかな音声を生成する効率的な音声合成モデル

一般的な紹介 ココロ82MはHugging Faceが提供する効率的な音声合成モデルで、少ないパラメータとデータで高品質な音声を生成するように設計されています。このモデルは8,200万個のパラメータを持ち、Apache 2.0ライセンスの下で配布され、幅広い音声パック(Voicepacks)をサポートしています。

ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具-首席AI分享圈

ebook2audiobook: 電子書籍をオーディオブックに変換する、多言語サポートと音声クローンを持つオープンソースツール

一般的な紹介 ebook2audiobookは、強力なオープンソースの電子書籍からオーディオブックツールです。複数の形式の電子書籍を、完全なチャプターマーカーとメタデータ付きのオーディオブックに変換することができます。このツールは、電子書籍フォーマットの変換にCalibreを使用し、オーディオブックへの変換にCoquiのXTTSv2とFairseqを使用しています。

Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面-首席AI分享圈

Edge TTS Worker: Cloudflare、OpenAI互換フォーマット、パッケージ化されたウェブインターフェースを使用したMicrosoft音声合成APIの展開

概要 Edge TTS Worker(depends on edge-tts )は、Microsoft Edge TTSサービスをOpenAIフォーマットと互換性のあるAPIインターフェースにカプセル化する、Cloudflare Worker上にデプロイされたプロキシサービスです。このプロジェクトにより、ユーザはMicrosoftの認証なしで簡単に利用することができます。

ViiTor AI:音频/视频多语言翻译合成与语音克隆服务-首席AI分享圈

ViiTor AI:音声・映像の多言語翻訳合成と音声クローン作成サービス

総合紹介 ViiTor AIは、高品質な動画翻訳、音声クローン、AI生成アバター動画、音声合成サービスの提供に特化した強力な人工知能プラットフォームです。このプラットフォームは多言語をサポートし、ユーザーが簡単に多言語コンテンツ作成を実現できるように設計されています。ViiTor AIの動画翻訳...

Wondercraft:专注广告配音、多人有声读物和播客的文本转音频工具-首席AI分享圈

Wondercraft: 広告のボイスオーバー、マルチプレイヤー・オーディオブック、ポッドキャストに特化したテキスト音声化ツール

総合紹介 ワンダークラフトは、コンテンツクリエイターにワンストップのオーディオ/ビデオ制作ソリューションを提供する、AIを活用した画期的なオーディオ/ビデオ制作プラットフォームです。このプラットフォームは、高度なAI技術を使用してテキストコンテンツを自然で滑らかな音声に変換し、20以上の言語をサポートし、200以上のAI...

NotebookLM Podcast:任何文档生成多语言个性化AI播客(付费)-首席AI分享圈

NotebookLM Podcast:あらゆる文書から多言語パーソナライズAIポッドキャストを生成(有料)

概要 NotebookLM Podcastは、人工知能技術を活用して、あらゆるテキストコンテンツをダイナミックで魅力的なオーディオポッドキャストに変換する革新的なプラットフォームです。NotebookLMポッドキャストは、学生、教育者、コンテンツ制作者、多忙なプロフェッショナルなど、どのような方にもパーソナライズされた...

ja日本語