AI音声合成

全79記事
Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成

Sherpa-ONNX: ONNXRuntimeによるオフライン音声認識と合成

概要 sherpa-onnxは、Next-gen Kaldiチームによって開発されたオープンソースプロジェクトで、効率的なオフライン音声認識および音声合成ソリューションを提供します。Android、iOS、Raspber...など複数のプラットフォームをサポートしています。
7ヶ月前
06.5K
SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声

SoniTranslate: オープンソース動画翻訳ダビングソリューション、複数ダビング、速度調整、オリジナルサウンドの模倣

概要 SoniTranslate はパワフルでユーザーフレンドリーなビデオ多言語ダビングツールです。高度な音声認識と機械翻訳技術により、ビデオ コンテンツを多言語に翻訳し、音声を同期させます。この ...
10ヶ月前
06.1K
ViiTor AI:音频/视频多语言翻译合成与语音克隆服务

ViiTor AI:音声・映像の多言語翻訳合成と音声クローン作成サービス

総合紹介 ViiTor AIは、高品質な動画翻訳、ボイスクローン、AI生成アバター動画、音声合成サービスの提供に特化した強力な人工知能プラットフォームです。このプラットフォームは多言語をサポートし、ユーザーが簡単に多言語コンテンツ作成を実現できることを目指しています。
8ヶ月前
05.8K
Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)

ココロTTS API: 高速音声合成のためのDocker化FastAPIラッパー (ココロ-82Mモデル)

概要 Kokoro-FastAPIは、Kokoro-82M音声合成モデルをサポートするために設計されたDockerベースのFastAPIラッパーです。このプロジェクトはNVIDIA GPUアクセラレーションをサポートし、キュー処理と自動スプライシングを提供します。
7ヶ月前
05.5K
GizAI:全能AI助手,集成主流生成式AI工具,让每个人免费使用商业化AI工具

GizAI:オールインワンのAIアシスタント、主流の生成AIツールを統合し、商用AIツールを誰でも無料で使えるようにする

はじめに GizAIは、AI生成、ノート作成、クラウドストレージ機能を統合したワンストッププラットフォームです。ユーザーは、GizAIで画像、動画、音声、テキスト、キャラクター、ストーリー、ゲームを生成し、プラットフォーム上で共同メモやクラウドストレージを取ることができます。
8ヶ月前
05.1K
FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑

FreeTTS:無料オンライン音声合成ツール|オーディオエンハンスメント|オーディオクリップ

FreeTTS 概要 FreeTTSは、テキストを自然な音声ファイルに変換できる無料のオンライン音声合成ツールです。複数の言語とサウンドオプションをサポートし、ユーザーはテキストをMP3、WAV、OGG、ACC形式に変換することができます...
11ヶ月前
04.7K
PDF2Audio:将PDF转换为音频的工具,PDF转播客

PDF2Audio: PDFから音声への変換ツール、PDFからポッドキャストへ

概要 PDF2Audioは、PDFファイルをポッドキャスト、講義、要約などの音声コンテンツに変換するために設計されたオープンソースプロジェクトです。このツールは、テキスト生成とテキスト音声変換にOpenAIのGPTモデルを活用しており、ユーザは複数のPDFファイルをアップロードすることができます。
10ヶ月前
04.6K
Weights:模仿声音翻唱歌曲和文本转语音的创作平台

Weights:声真似カバーソングと音声合成オーサリングプラットフォーム

はじめに Weightsは、簡単な操作でボイスカバー、音声合成、画像、音楽、動画を作成できる、AIを活用したクリエイティビティのためのソーシャルプラットフォームです。このプラットフォームは、ユーザーが素早く創作を始め、コミュニティと共有できるよう、豊富なツールやテンプレートを提供しています。
6ヶ月前
04.2K
Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面

Edge TTS Worker: Cloudflare、OpenAI互換フォーマット、パッケージ化されたウェブインターフェースを使用したMicrosoft音声合成APIの展開

概要 Edge TTS Worker(edge-tsに依存)は、Microsoft Edge TTSサービスをOpenAI互換フォーマットでカプセル化し、Cloudflare Workerにデプロイされたプロキシサービスです。
8ヶ月前
04.2K
Murf AI:变声大师|语音转文本|文本生成语音|音频编辑器

Murf AI: ボイスチェンジャー|音声テキスト|テキストから音声へ|音声エディター

一般的な紹介 Murf AIは、テキストを人間に近い音声に変換する、強力なオンライン人工知能音声生成ツールです。最大120以上のAI音声オプションを提供し、20以上の言語をサポートし、ポッドキャスト、ビデオ、プロのプレゼンテーションなど様々な状況に適しています。
10ヶ月前
04.2K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: 動画から字幕へのネイティブクライアント、多言語字幕の変換

概要 MemoAIは、ビデオやオーディオファイルをテキスト、字幕、メモに変換するために設計された強力なビデオ翻訳ツールです。YouTubeの動画でも、ポッドキャストでも、ローカルファイルでも、MemoAIは簡単に扱うことができます。中国語、英語、日本語など90以上の言語に対応しています。
8ヶ月前
04.1K
EmotiVoice(易魔声):多声音与情感提示控制的文本转语音引擎

EmotiVoice:マルチボイスおよび感情キューイングコントロール付き音声合成エンジン

総合紹介 EmotiVoiceは、NetEaseYoudaoによって開発された、複数の音声と感情キュー制御を備えた音声合成(TTS)エンジンです。このオープンソースのTTSエンジンは、英語と中国語をサポートし、2000以上の異なる音声を持ち、感情合成機能を持ち、幸せな音声を作成することができます。
5ヶ月前
04K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: 電子書籍をオーディオブックに変換する、多言語サポートと音声クローンを持つオープンソースツール

一般的な紹介 ebook2audiobookは、強力なオープンソースの電子書籍からオーディオブックツールです。複数のフォーマットのeBookを、完全なチャプターマーカーとメタデータ付きのオーディオブックに変換することができます。このツールは、電子書籍フォーマットの変換にCo...
7ヶ月前
03.9K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez: ココロでオーディオブックを作成、電子書籍をオーディオブックに変換

概要 Audiblezは、電子書籍(.epub形式など)をオーディオブック(.m4b形式など)に変換するためのオープンソースプロジェクトです。Kokoroの高品質音声合成技術を利用し、多言語・多音声をサポートしています。ユーザーは単純に...
7ヶ月前
03.9K
腾讯智影:智能视频创作工具|AI数字人、动漫生成套件

テンセント・スマート・シャドウ:インテリジェント動画作成ツール|AIデジタルマン、アニメ生成キット

総合紹介 Tencent Smart Shadowは、テンセントが開始したオンラインインテリジェント動画作成プラットフォームで、クラウドサービスによって提供される強力なAIツールにより、テキストダビング、デジタル人力放送、自動字幕認識などの機能をサポートします。
1年前
03.9K
Orpheus-TTS:生成自然中文语音的文本转语音工具

Orpheus-TTS:自然な中国語音声を生成する音声合成ツール

概論 Orpheus-TTSは、人間の自然な音声に近い音声を生成することを目標に、Llama-3bアーキテクチャで開発されたオープンソースの音声合成(TTS)システムです。Canopy AIチームによって開発され、英語、スペイン語、フランス語に対応しています。
4ヶ月前
03.7K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

ココロ-ONNX:多言語・多音声をサポートする効率的な音声合成ツール

包括的な紹介 ココロ-ONNXは、ONNXランタイムをベースとしたオープンソースの音声合成(TTS)ツールです。thewh1teagleによって開発されたこのプロジェクトは、効率的で高速な音声合成ソリューションを提供することを目的としています。
7ヶ月前
03.7K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI:たった1枚の写真でデジタル人語動画を生成、複数の無料動画生成ツール

概要説明 Vidnozは、1分以内に素早くAIビデオを作成するための無料のAIビデオ生成プラットフォームです。費用、ダウンロード、経験は必要ありません。このプラットフォームは、500以上のAIアバター、470以上のリアルなAIナレーション、500以上のテンプレートを提供しています。VidnozのAIビデオ...
12ヶ月前
03.7K
NotebookLM:知识笔记检索阅读,多类文档生成语音对话播客

NotebookLM:知識ノート検索読書、マルチクラス文書生成音声対話ポッドキャスト

はじめに NotebookLMは、Googleが提供するパーソナライズされたAIコラボレーションツールで、ユーザーの頭脳を最大限に活用できるように設計されている。ユーザーがドキュメントをアップロードすると、NotebookLMは即座にこれらのソースからコンテンツをマスターし、ユーザーが簡単に読めるようにします。
2ヶ月前
03.6K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: AIがラップと音声を生成するプラットフォーム|Text to Speech|テキスト・トゥ・スピーチ

概要 Uberduck AIは、クリエイティブ・エージェンシー、音楽プロデューサー、プログラマー向けに、歌声や話し声のAI合成を提供する革新的なプラットフォームです。ユーザーは、さまざまな音楽のリズムを選択し、AIを使って歌詞を生成したり、自分で書いたり、特定のサウンドを選択して、最終的にラップソングを作成することができます...
11ヶ月前
03.6K
TTSMaker:免费的在线文本转语音工具

TTSMaker:無料オンライン音声合成ツール

概要 TTSMakerは、100以上の言語と300以上の音声スタイルをサポートする無料のオンライン音声合成ツールです。ユーザーは、テキストを自然で滑らかな音声に変換し、商用利用のために音声ファイルをダウンロードすることができます。このツールは、ビデオのダビング、オーディオブック、教育やトレーニングに適しています。
12ヶ月前
03.6K
Kokoro:高效语音合成模型,生成自然流畅的语音

こころ:自然で滑らかな音声を生成する効率的な音声合成モデル

一般的な紹介 ココロ82MはHugging Faceが提供する効率的な音声合成モデルで、より少ないパラメータとデータで高品質な音声を生成するように設計されています。このモデルは8,200万個のパラメータを持ち、Apache 2.0の下でライセンスされています。
7ヶ月前
03.5K
Ondoku:在线文本朗读工具|文本转语音|图片转语音朗读

Ondoku: オンラインテキストリーダー|テキストから音声へ|画像から音声へリーダー

Ondoku 概要 Ondokuはオンライン音声合成ソフトウェアです。ユーザーがウェブサイトが提供するテキストボックスにテキストコンテンツを入力すると、ソフトウェアがユーザーのニーズに合わせて記事を音声読み上げに変換し、音声をMP3形式のファイルとして保存することができます。このサービスは、インスタントリスニングにも...
10ヶ月前
03.5K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: 高品質音声生成とクローニングのためのオープンソース音声合成モデル

概要 Llasa-3Bは、香港科学技術大学オーディオ研究室(HKUST Audio)が開発したオープンソースの音声合成(TTS)モデルです。このモデルはLlama 3.2Bアーキテクチャに基づいており、複数の音声合成をサポートするだけでなく、高品質な音声合成を提供するために慎重に調整されています。
6ヶ月前
03.5K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

Record Cafe: ワンストップ音声・映像処理プラットフォーム|動画生成|AI字幕|音声抽出|音声テキスト化

総合紹介 Record Cafeはワンストップの音声/動画処理プラットフォームで、AI動画対話、AI字幕、AI音声テキスト化サービスを提供する。画面録画、動画編集、GIF/音声変換などの機能があり、クラウドストレージや共有もサポートします。インターフェースは直感的で使いやすく、マルチスクリーン録画と多言語スマートフォンにも対応しています。
8ヶ月前
03.5K
Descript:一站式视频与播客编辑,简单如编辑文档

説明: ワンストップでビデオやポッドキャストを編集。

Descript 一般的な説明 Descriptは、パワフルでありながら使いやすいビデオおよびポッドキャスト編集ツールです。業界トップクラスの書き起こし精度とスピード、強力な修正ツールに加え、AI技術で動画をテキストに書き起こしたり、テキストを編集して動画を編集する機能も備えています。さらに...
10ヶ月前
03.5K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: 地域展開のためのAI音声ツールキット

包括的な紹介 Easy-Voice-ToolkitはOpen Source Speech Projectに基づく多機能なツールキットで、音声認識、音声トランスクリプション、音声変換、データセット作成、モデルトレーニングのための幅広い自動音声ツールを提供します。ユーザーは、必要に応じてこれらのツールを選択的に使用することができます...
11ヶ月前
03.5K
DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人

DupDub:AI搭載ビデオエディター|ダビング|ビデオ翻訳|フォトデジタイザー

概要 Dupdubは、ユーザーの創造性をサポートする様々なAIツールを提供する、サイドヘビーポッドキャストおよびビデオプレゼンテーション作成プラットフォームです。テキストからビデオへの作成、AIによる音声やビデオの吹き替えサービス、ビデオ編集、文字起こし、字幕作成などの機能を備えています。 また、Dupdubは...
12ヶ月前
03.5K
逗哥配音:专注短视频解说、创作的智能配音神器

ティザーアフレコ:短編映像のナレーションと制作に特化したインテリジェントアフレコツール

総合紹介 Tease Dubbingは500万人以上のユーザーを持つ人気のAIダビングソフトです。このソフトは先進的なAI知能ダビング技術を使って、プロでリアルなダビング効果を提供し、ショートビデオ、広告制作、教育訓練などのシーンに適しています。Teaser Dubbingは、ユーザーに迅速な...
10ヶ月前
03.4K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: 実験的音声合成モデル、純粋な言語モデリングアプローチで実装されたTTS

包括的な紹介 OuteTTSは、純粋な言語モデリングアプローチを用いて高品質の音声を生成する、実験的な音声合成(TTS)モデルです。従来のTTSシステムとは異なり、OuteTTSは外部アダプターや複雑なアーキテクチャを必要としません。このモデルは、LLaMaアーキテクチャに基づいています。
6ヶ月前
03.3K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: 高速でコントロール可能な多言語(7000以上の言語に対応)音声合成ツール

一般的な紹介 IMS Toucanはドイツのシュトゥットガルト大学の自然言語処理研究所(IMS)によって開発された最先端の音声合成(TTS)ツールキットです。このツールキットは7000以上の言語をサポートし、高速で、制御可能で、必要な計算資源が少ない。
6ヶ月前
03.3K
ElevenLabs:高质量AI语音生成平台,文字配音和语音克隆工具

イレブンラボ:高品質AI音声生成プラットフォーム、テキストダビング、音声クローニングツール

はじめに イレブンラボは、米国ニューヨークに拠点を置く、ジェネレーティブAIスピーチの分野に特化した新興企業である。同社は、テキスト生成音声、スピーチ生成音声、音声クローン、音声認識のための強力なサービスを提供しています。
11ヶ月前
03.3K
PodLM:将对话、网页或长文本生成多语言音频播客(付费)

PodLM:ダイアログ、ウェブページ、長文の多言語オーディオポッドキャストを生成(有料)

PodLMの概要 PodLMは、ユーザーがテキスト、ドキュメント、URLコンテンツを高品質のポッドキャスト音声に素早く変換できるように設計された、最先端のAIポッドキャスト生成プラットフォームです。最先端のAI技術を活用することで、PodLMは構造化された魅力的なポッドキャスト・スクリプトを自動生成することができます。
10ヶ月前
03.3K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。

一般的な紹介 OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成(TTS)APIを提供するオープンソースプロジェクトです。このプロジェクトでは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質な音声合成を行うことができます。
7ヶ月前
03.3K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS:パーソナライズされたポッドキャストの音声トレーニングと合成

Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成(TTS)モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3...をベースにしています。
3ヶ月前
03.3K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS:実際の人の話し声を模倣した音声生成モデル(ChatTTSワンクリックアクセラレーションパッケージ)

一般的な紹介 ChatTTSは対話シナリオ用に設計された生成音声モデルです。自然で表現力豊かな音声を生成し、多言語、複数話者をサポートし、対話型ダイアログに適しています。このモデルは、笑い、ポーズ、間投詞のようなきめ細かなリズムの特徴を予測し、制御することで、対話に適した音声を生成します。
6ヶ月前
03.2K
Resemble AI:人工智能语音合成平台|声音克隆|深度伪造音频检测

Resemble AI:人工知能音声合成プラットフォーム|ボイスクローン|ディープフェイクオーディオ検出

総合紹介 リセンブルAIは、企業向けに設計された人工知能音声合成プラットフォームです。このプラットフォームは、最先端のAI音声生成技術と、将来の情報セキュリティのためのディープフェイクオーディオ検出を提供します。特徴として、音声クローニング、リアルタイムな偽造音声検出、AI透かし技術...
10ヶ月前
03.2K
Wondercraft:专注广告配音、多人有声读物和播客的文本转音频工具

Wondercraft: 広告のボイスオーバー、マルチプレイヤー・オーディオブック、ポッドキャストに特化したテキスト音声化ツール

概要 ワンダークラフトは、コンテンツ制作者に音声・映像制作のためのワンストップ・ソリューションを提供する、AIを活用した画期的な音声・映像制作プラットフォームです。高度なAI技術により、テキストコンテンツを自然で滑らかな音声に変換し、20以上の言語に対応します。
8ヶ月前
03.2K
海藻AI:智能语音合成与声音克隆平台

海藻AI:インテリジェント音声合成と音声クローニング・プラットフォーム

総合紹介 Seaweed AIは、Yun Zhisheng AIオープンプラットフォームを搭載した、オンラインでテキストを音声に変換できるインテリジェントなダビング製品です。ユーザー自身が音声クローンを作成し、性別、アクセント、言語の異なるAI発音者を提供し、テキスト入力後に直接音声をダビングすることができます。また、テキストを入力した後、直接音声をダビングすることもできます。
10ヶ月前
03.1K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate:よく知られた音声生成、音声トランスクリプション、音声モデリングを統合する統一API

概要 Orateは、音声生成と文字起こしに特化したAIツールキットです。Orateは、OpenAI、ElevenLabs、AssemblyAIなどの主要なAIプロバイダーとシームレスに統合する統一APIを提供し、ユーザーが強制的に音声を作成できるようにします。
6ヶ月前
03.1K
音剪:喜马拉雅自然人声、多人旁白音频创作平台

サウンドクリッピング:ヒマラヤの自然な人の声、マルチナレーター音声作成プラットフォーム

包括的な紹介 Himalaya Audio Editorは包括的なAIオーディオ作成プラットフォームです。プロ級のポッドキャスト制作、マルチトラックレコーディング、オーディオ編集、テキストを音声に変換する機能など、ユーザーをサポートする強力な機能を提供します。また、このプラットフォームにはプロフェッショナルな音声のための複数のオプションが含まれており、ユーザーをサポートします...
1年前
03.1K
Hume AI:赋予AI情感识别能力|从声音和表情识别情感状态|生成具有情感状态的语音

Hume AI: 感情認識でAIを強化する|音と表情から感情を認識する|感情のある音声を生成する

概論 ヒュームAIは感情知能に特化したAI企業で、人間の感情を理解し反応するマルチモーダルAI技術を開発している。同社の主力製品であるEmpathic Voice Interface(EVI)は、ユーザーの感情を認識し、それに応答することができる。
10ヶ月前
03.1K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

マジック・ボイス・ワークショップ:プロフェッショナル・ボイスオーバー&ショートビデオ・ナレーション作成プラットフォーム|リアル・パーソン・ボイスオーバー|クローン・ボイス|ワンクリックで映像化

総合紹介 マジックボイス工房は、ソフトウェアアフレコ、リアルアフレコ、サウンドライブラリ、クローンサービスなどの情報をワンストップで提供するショートビデオ・AIアフレコプラットフォームです。このプラットフォームは、音声編集、AIコピー生成、ビデオ編集、音声関連サービスやコンテンツ制作のためのコラボレーションツールを統合しています。ユーザーはオーディオ編集を体験...
10ヶ月前
03K
XAudioPro:专业在线音频剪辑工具|有声书制作|文字转语音|伴奏分离

XAudioPro: プロフェッショナルオンラインオーディオ編集ツール|オーディオブック制作|テキストからスピーチへ|伴奏分離

概要 XAudioProは、プロフェッショナルかつポータブルな先進的なオンラインオーディオリアルタイム編集およびトランスコードツールです。カット、クロップ、コピー、削除、復元、振幅ゲインコントロールなどのプロフェッショナルなオーディオ編集機能をサポートします。また、スペクトルサブトラクションノイズ除去、ローパスノイズ除去などのノイズ除去サービスも提供します。
10ヶ月前
03K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: 入力テキストから話者固有の音声合成モデルを生成する

一般的な紹介 Parler-TTSは、Hugging Face社によって開発されたオープンソースの音声合成(TTS)モデルライブラリで、高品質で自然な音声を生成するように設計されています。このモデルは、特定の話者スタイル(性別、ピッチ、話し方など)の入力テキストに基づいて音声を生成することができます。
6ヶ月前
03K
YouTube Dubbing:实时将YouTube视频翻译为不同语言并同步配音

YouTubeダビング:YouTubeの動画をさまざまな言語に翻訳し、リアルタイムでダビングを同期させます。

概要 YouTube Dubbingは、動画クリエイターと視聴者に多言語吹き替えサービスを提供するために設計されたインテリジェントな吹き替えプラットフォームです。AI技術により、YouTube動画を自動的に翻訳し、吹き替え音声を生成します。ユーザーがインストールする必要があるのは...
10ヶ月前
03K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

Podcastfy:NotebookLMのポッドキャスティング機能に代わるオープンソースの多言語音声会話ツール、マルチソースコンテンツ

一般的な紹介 PodcastfyはオープンソースのPythonパッケージで、生成人工知能(GenAI)技術を使用して、ウェブコンテンツ、PDFファイル、テキスト、画像、YouTube動画、その他多くのソースを魅力的な多言語に変換します。
10ヶ月前
03K
Jellypod:制作多语言AI播客,创建、编辑和分发AI播客

Jellypod: 多言語AIポッドキャストの制作、AIポッドキャストの作成、編集、配信

概要 Jellypodは、ユーザーが簡単に高品質のAIポッドキャストを作成、編集、公開できるように設計された強力なAIポッドキャストスタジオです。Jellypodを使用すると、ユーザーは、パーソナライズされたポッドキャストホストを設計し、スクリプトを洗練させ、ポッドキャストを公開することができます。
7ヶ月前
02.9K
NotebookLM Podcast:任何文档生成多语言个性化AI播客(付费)

NotebookLM Podcast:あらゆる文書から多言語パーソナライズAIポッドキャストを生成(有料)

概要 NotebookLM Podcastは、人工知能技術を使ってあらゆるテキストコンテンツをダイナミックで魅力的なオーディオポッドキャストに変換する革新的なプラットフォームです。学生、教育者、コンテンツ制作者、多忙なプロフェッショナルなど、NotebookLM...
8ヶ月前
02.9K
PlayAI:提供流畅、富有情感的语音对话和语音合成服务(英文)

PlayAI:スムーズで感情的な音声対話と音声合成サービスの提供(英語)

概論 PlayAIは、音声生成と音声クローニングに特化したAIプラットフォームである。スムーズで感情的なダイアログを生成できる幅広い音声モデルを提供しています。ユーザーはこのプラットフォームを使って、対話体験を向上させるパーソナライズされた音声エージェントを作成することができます。
9ヶ月前
02.9K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: PDFをオープンソースツールのポッドキャストに変換する

概要 Open NotebookLMは、あらゆるPDF文書をポッドキャストに変換するために設計されたオープンソースプロジェクトです。このツールは、オープンソースのLarge Language Model (LLM)とText-to-Speech (TTS)モデルを使用してPDFコンテンツを処理し、オーディオポッドキャストに適した自然なダイアログを生成します...
6ヶ月前
02.9K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3:中国語音声と英語音声を合成する軽量モデル

包括的な紹介 MegaTTS3は、ByteDanceが浙江大学と共同で開発したオープンソースの音声合成ツールで、高品質な中国語と英語の音声を生成することに重点を置いています。MegaTTS3のコアモデルは、わずか0.45Bパラメータで、軽量かつ効率的です。このプロジェクトは ...
5ヶ月前
02.8K
猫与星:和孩子一起编写专属童话故事的听故事APP

キャット&スター:お子様と一緒に専用の童話を書くための物語リスニングアプリ

総論 "猫と星"(maoyuxing.com)は、子供のために設計されたインタラクティブな物語作成プラットフォームであり、モバイルアプリケーションを通じて、親子が一緒にパーソナライズされたおとぎ話を作成するのに役立ちます。ユーザーは、子供の名前や好みなどの情報を入力することで、ユニークな物語コンテンツを作成することができる。
6ヶ月前
02.8K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio:オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。
3ヶ月前
02.7K
Acoust:在线AI语音生成和文本转语音(TTS)服务平台

Acoust: オンラインAI音声生成・音声合成(TTS)サービスプラットフォーム

概要 Acoustは、最新のAI技術を駆使してリアルな音声を生成する、オンラインAI音声生成・音声合成(TTS)サービスプラットフォームです。また、強力なビデオ編集ツールも提供しており、ユーザーは複数のソフトウェアを使用することなくビデオ制作を完了することができます。
7ヶ月前
02.6K
Azure TTS Importer:将语音合成服务集成到阅读软件中

Azure TTS Importer:音声合成サービスを読み上げソフトウェアに統合する

包括的な紹介 TTS Importerは、Azure TTS(Text-to-Speech)音声合成サービスを様々な読み上げソフトに簡単にインポートできるように設計されたオープンソースプロジェクトです。このツールは、Read(legado...)を含むいくつかの一般的な読み上げソフトウェアをサポートしています。
6ヶ月前
02.6K
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast:プロンプトの誘導語を設定してPDFをポッドキャストに変換するAIツール

概論 NVIDIA AI Blueprint: PDF to Podcastは、NVIDIAが開発したオープンソースプロジェクトで、PDFドキュメントを魅力的なオーディオコンテンツに変換します。このプロジェクトは、NVIDIA NIM (NVIDIA AI Blueprint) を活用しています。
6ヶ月前
02.5K
集成多种先进语音合成服务的开源运营项目

複数の高度な音声合成サービスを統合したオープンソース運用プロジェクト

概要 Open-VoiceCanvasは、ItusiAIチームによって開発されたオープンソースの音声合成プラットフォームです。50以上の言語をサポートし、テキストを自然な音声に変換したり、音声をアップロードすることでパーソナライズされた音声をクローンすることができます。このプロジェクトはOpe...
4ヶ月前
02.5K
PlayHT:生成超真实语音的AI工具

PlayHT:超リアルな音声を生成するAIツール

概要 PlayHTは、AI音声生成に特化した効率的なオンラインプラットフォームで、ユーザーがテキストを自然でリアルな音声に素早く変換できるよう支援します。60以上の言語と多様なアクセントをサポートする600以上のAI音声を提供し、ポッドキャスト制作、教育コンテンツ、マーケティングプロモーション...
5ヶ月前
02.4K
Dia:生成超现实多人对话的文本转语音模型

Dia:超リアルな多人数対話生成のための音声合成モデル

一般的な紹介 Diaは、Nari Labsによって開発されたオープンソースのテキスト音声合成(TTS)モデルで、超リアルなダイアログ音声を生成することに重点を置いています。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、さらに非言語表現も生成します。
4ヶ月前
02.4K
Paper to Podcast:把学术论文转换为多人对话播客

論文からポッドキャストへ:学術論文を多人数会話のポッドキャストに変換する

一般的な紹介 Paper to Podcastは、学術研究論文を生き生きとした楽しいポッドキャストに変換することに特化したオープンソースのツールです。人工知能技術を使ってPDF形式の論文を3人の登場人物(ホスト、学習者、専門家)の対話に変え、複雑な...
4ヶ月前
02.3K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice:シリコンベースのフローAPIに基づく音声合成グラフィカルインターフェース

一般的な紹介 Text2Voiceは、シリコンベースのモビリティAPIに基づいた音声合成機能を提供するオープンソースツールで、クリーンなグラフィカル・ユーザー・インターフェース(GUI)が最大の特徴である。開発者のシェルドン・リーがGitHubで作成したもので、...
4ヶ月前
02.3K
Podcastle:快速创建高质量播客的AI工具

Podcastle:高品質のポッドキャストを素早く作成するAIツール

概要 Podcastleは、AIベースのオンラインプラットフォームで、ユーザーが高品質なポッドキャストを素早く作成・編集できるよう支援することに特化しています。録音、編集、公開の機能が統合されており、ユーザーは特別な機器や複雑なソフトウェアを必要とせず、すべてブラウザから行うことができる。このプラットフォームが利用するのは...
5ヶ月前
02.1K