AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
全75記事

タグ: 音声合成AIテキスト 4ページ

EmotiVoice(易魔声):多声音与情感提示控制的文本转语音引擎-首席AI分享圈

EmotiVoice:マルチボイスおよび感情キューイングコントロール付き音声合成エンジン

総合紹介 EmotiVoiceは、NetEaseYoudaoによって開発された、複数の音声と感情キュー制御を備えた音声合成(TTS)エンジンです。このオープンソースのTTSエンジンは、英語と中国語をサポートし、2000以上の異なる音声を持ち、感情合成機能により、喜怒哀楽の複数の音声を作成することができます。

Listnr:多语言AI语音生成器,变革性人声合成技术-首席AI分享圈

Listnr: 多言語AIスピーチジェネレーター、革新的な人間の音声合成技術

一般的な紹介 Listnrは、142以上の言語で1,000種類以上の音声合成を行う生成AIエンジンを搭載した音声合成ソフトウェアです。このプラットフォームは、ショートビデオ、YouTubeビデオ、ゲームキャラクター、ポッドキャストなど、100万人以上のユーザーに利用されています。

Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音-首席AI分享圈

Uberduck: AIがラップと音声を生成するプラットフォーム|Text to Speech|テキスト・トゥ・スピーチ

概要 Uberduck AIは、クリエイティブ・エージェンシー、音楽プロデューサー、プログラマー向けに、歌声や話し声のAI合成を提供する革新的なプラットフォームです。ユーザーは、様々な音楽のリズムを選択し、AIを使って歌詞を生成したり、自分で書いたり、特定のサウンドを選択し、最終的にオーディオまたはビデオフォーマットでラップソングを作成することができます...

NotebookLM:知识笔记检索阅读,多类文档生成语音对话播客-首席AI分享圈

NotebookLM:知識ノート検索読書、マルチクラス文書生成音声対話ポッドキャスト

はじめに NotebookLMは、Googleが提供するパーソナライズされたAIコラボレーションツールで、ユーザーの頭脳を最大限に活用できるように設計されています。ユーザーはドキュメントをアップロードすることができ、NotebookLMは即座にこれらのソースのコンテンツをマスターし、ユーザーは簡単に読み、メモを記録し、最適化し、ツールを使用することができます...

录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字-首席AI分享圈

Record Cafe: ワンストップ音声・映像処理プラットフォーム|動画生成|AI字幕|音声抽出|音声テキスト化

総合紹介 Record Cafeはワンストップの音声/動画処理プラットフォームで、AI動画対話、AI字幕、AI音声テキスト化サービスを提供する。画面録画、動画編集、GIF/音声変換などの機能があり、クラウドストレージや共有もサポートします。インターフェースは直感的で使いやすく、マルチスクリーン録画と多言語インテリジェント読み上げもサポートします。

IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具-首席AI分享圈

IMS Toucan: 高速でコントロール可能な多言語(7000以上の言語に対応)音声合成ツール

概論 IMS Toucanはドイツのシュトゥットガルト大学の自然言語処理研究所(IMS)によって開発された最先端の音声合成(TTS)ツールキットです。7000以上の言語をサポートするこのツールキットは、高速で、制御可能で、必要な計算資源が少なくて済みます。IMS Toucanは、研究、教育...

ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)-首席AI分享圈

ChatTTS:実際の人の話し声を模倣した音声生成モデル(ChatTTSワンクリックアクセラレーションパッケージ)

一般的な紹介 ChatTTSは対話シナリオ用に設計された生成音声モデルです。自然で表現力豊かな音声を生成し、多言語、複数話者をサポートし、対話型ダイアログに適しています。このモデルは、笑い、ポーズ、間投詞のような細かな韻律的特徴を予測し、制御することで、大規模なモデルを超えています...

FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑-首席AI分享圈

FreeTTS:無料オンライン音声合成ツール|オーディオエンハンスメント|オーディオクリップ

FreeTTS 概要 FreeTTSは、テキストを自然な音声ファイルに変換できる無料のオンライン音声合成ツールです。複数の言語とサウンドオプションをサポートし、ユーザーはテキストをMP3、WAV、OGG、ACC形式に変換することができます。FreeTTSはまた、音声転写、サウンド...

ElevenLabs:高质量AI语音生成平台,文字配音和语音克隆工具-首席AI分享圈

イレブンラボ:高品質AI音声生成プラットフォーム、テキストダビング、音声クローニングツール

はじめに イレブンラボは、米国ニューヨークに拠点を置く、ジェネレーティブAIスピーチの分野に特化した新興企業である。同社は、テキスト生成音声、音声生成音声、音声クローン、音声認識のための強力なサービスを提供しています。イレブンラボの強みは、強力な多言語サポートにあります...

Easy Voice Toolkit:本地部署的AI语音工具箱-首席AI分享圈

Easy Voice Toolkit: 地域展開のためのAI音声ツールキット

包括的な紹介 Easy-Voice-Toolkitは、音声認識、音声トランスクリプション、音声変換、データセット作成、モデルトレーニングのための幅広い自動音声ツールを提供する、オープンソーススピーチプロジェクトに基づいた多目的ツールキットです。ユーザーは必要に応じて、これらのツールを選択的または連続的に使用することができます...

DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人-首席AI分享圈

DupDub:AI搭載ビデオエディター|ダビング|ビデオ翻訳|フォトデジタイザー

概要 Dupdubは、ユーザーの創造性をサポートする様々なAIツールを提供する、サイドヘビーポッドキャストおよびビデオプレゼンテーション作成プラットフォームです。テキストから動画への変換、AIによる音声や動画の吹き替えサービス、動画編集、文字起こし、字幕作成などの機能を提供しています。 Dupdubは再びOutdoor...

TTSMaker:免费的在线文本转语音工具-首席AI分享圈

TTSMaker:無料オンライン音声合成ツール

概要 TTSMakerは、100以上の言語と300以上の音声スタイルをサポートする無料のオンライン音声合成ツールです。ユーザーは、テキストを自然で滑らかな音声に変換し、商用利用のために音声ファイルをダウンロードすることができます。このツールは、ビデオのダビング、オーディオブック、教育やトレーニング、広告やマーケティングに適しています。

Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具-首席AI分享圈

Vidnoz AI:たった1枚の写真でデジタル人語動画を生成、複数の無料動画生成ツール

概要説明 Vidnozは、1分以内に素早くAIビデオを作成するための無料のAIビデオ生成プラットフォームです。費用、ダウンロード、経験は必要ありません。このプラットフォームは、500以上のAIアバター、470以上のリアルなAIナレーション、500以上のテンプレートを提供しています。Vidnoz AI Video Generatorを使えば、ユーザーはより早く、よりリアルな動画を作成することができます。

Memo AI:视频转字幕、转换多语言字幕的本地客户端-首席AI分享圈

Memo AI: 動画から字幕へのネイティブクライアント、多言語字幕の変換

概要 MemoAIは、ビデオやオーディオファイルをテキスト、字幕、メモに変換するために設計された強力なビデオ翻訳ツールです。YouTubeの動画、ポッドキャスト、ローカルファイルなど、MemoAIなら簡単に扱うことができます。中国語、英語、日本語など、90以上の言語の書き起こしや翻訳をサポートしています。

腾讯智影:智能视频创作工具|AI数字人、动漫生成套件-首席AI分享圈

テンセント・スマート・シャドウ:インテリジェント動画作成ツール|AIデジタルマン、アニメ生成キット

総合紹介 Tencent Smart Shadowは、テンセントが開始したオンラインインテリジェント動画作成プラットフォームで、クラウドサービスによって提供される強力なAIツールにより、テキストダビング、デジタル人力放送、自動字幕認識などの機能をサポートします。

pyvideotrans:视频翻译配音工具-首席AI分享圈

pyvideotrans:動画翻訳ダビングツール

pyVideoTrans 概要 pyvideotransはビデオ翻訳ダビングツールです。ユーザーはビデオコンテンツをある言語から別の言語に翻訳し、対応するボイスオーバーと字幕をビデオに追加することができます。openai-whisperオフラインモデルに基づいており、様々な翻訳・音声合成サービスをサポートしています。

音剪:喜马拉雅自然人声、多人旁白音频创作平台-首席AI分享圈

サウンドクリッピング:ヒマラヤの自然な人の声、マルチナレーター音声作成プラットフォーム

包括的な紹介 Himalaya Audio Editorは包括的なAIオーディオ作成プラットフォームです。プロ級のポッドキャスト制作、マルチトラックレコーディング、オーディオ編集をサポートし、テキストを音声に変換できる強力な機能を提供します。また、このプラットフォームにはプロフェッショナルな音声のための複数のオプションが含まれており、ユーザーは効率的に音声を作成することができます...

Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型-首席AI分享圈

Parler-TTS: 入力テキストから話者固有の音声合成モデルを生成する

一般的な紹介 Parler-TTSはHugging Faceによって開発されたオープンソースの音声合成(TTS)モデルライブラリで、高品質で自然な音声を生成するように設計されています。このモデルは、入力テキストに基づいて、特定の話者スタイル(性別、ピッチ、話し方など)の音声を生成することができます。

ja日本語