AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
全53記事

タグ: AI 音声合成 3ページ

Buzz:开源离线音频转写翻译工具|IOS语音转录-首席AI分享圈

Buzz: オープンソースのオフライン音声書き起こし翻訳ツール|IOS音声書き起こし

Buzz 概要 Buzzはchidiwilliamsによって作成されたオープンソースプロジェクトで、パーソナルコンピュータ上でオフラインでの音声の書き起こしや翻訳を可能にする。このプロジェクトはOpenAIのWhisperテクノロジーに依存しており、ユーザーはインターネット接続に依存せずに音声ファイルの書き起こしや翻訳作業を行うことができる。GitHub経由で...

Murf AI:变声大师|语音转文本|文本生成语音|音频编辑器-首席AI分享圈

Murf AI: ボイスチェンジャー|音声テキスト|テキストから音声へ|音声エディター

包括的な紹介 Murf AI は、テキストをほぼ実生活に近い音声に変換する、強力なオンライン人工知能音声生成ツールです。最大120以上のAIボイスオプションを提供し、20以上の言語をサポートし、ポッドキャスト、ビデオ、プロフェッショナルなプレゼンテーションなど様々な場面に適しています。

VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具-首席AI分享圈

VideoLingo: 動画書き起こし単語レベルタイムライン字幕、動画字幕翻訳、ローカライズ吹き替えオープンソースツール

一般的な説明 VideoLingoはNetflixの等級を、発生させるように設計されているワンストップビデオ翻訳および局在化のダビング用具である 良質のサブタイトルは、未加工機械翻訳および複数行サブタイトルを除去し、世界的な知識が言語障壁を渡って共有されることを可能にするために良質のボイスオーバーを加える。直感的なStreamlit ...

ALog:便携AI语音日记应用,支持语音转文字。-首席AI分享圈

ALog:音声読み上げ機能付きの携帯型AI音声日記アプリ。

一般的な紹介 ALogはAIベースの音声日記アプリケーションで、ユーザーが音声で日常生活を記録できるように設計されています。duxinsによって開発され、GitHubでオープンソース化されています。ユーザーは音声入力で日記を記録することができ、アプリは自動的に音声をテキストに変換し、インテリジェントに分析します...

录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字-首席AI分享圈

Record Cafe: ワンストップ音声・映像処理プラットフォーム|動画生成|AI字幕|音声抽出|音声テキスト化

総合紹介 Record Cafeはワンストップの音声/動画処理プラットフォームで、AI動画対話、AI字幕、AI音声テキスト化サービスを提供する。画面録画、動画編集、GIF/音声変換などの機能があり、クラウドストレージや共有もサポートします。インターフェースは直感的で使いやすく、マルチスクリーン録画と多言語インテリジェント読み上げもサポートします。

Babelfish.ai:浏览器运行的语音实时转录与翻译应用-首席AI分享圈

Babelfish.ai:ブラウザで動作するリアルタイム音声書き起こし翻訳アプリケーション

概論 Babelfish.aiは、Huggingface Transformer.jsとSupabase Realtimeで構築されたリアルタイム音声翻訳アプリケーションです。このアプリケーションは、ブラウザで大きなモデルを読み込み、ローカルで実行することで、リアルタイムの音声読み上げと翻訳機能を実現します。ユーザーはシンプルな...

FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑-首席AI分享圈

FreeTTS:無料オンライン音声合成ツール|オーディオエンハンスメント|オーディオクリップ

FreeTTS 概要 FreeTTSは、テキストを自然な音声ファイルに変換できる無料のオンライン音声合成ツールです。複数の言語とサウンドオプションをサポートし、ユーザーはテキストをMP3、WAV、OGG、ACC形式に変換することができます。FreeTTSはまた、音声転写、サウンド...

Easy Voice Toolkit:本地部署的AI语音工具箱-首席AI分享圈

Easy Voice Toolkit: 地域展開のためのAI音声ツールキット

包括的な紹介 Easy-Voice-Toolkitは、音声認識、音声トランスクリプション、音声変換、データセット作成、モデルトレーニングのための幅広い自動音声ツールを提供する、オープンソーススピーチプロジェクトに基づいた多目的ツールキットです。ユーザーは必要に応じて、これらのツールを選択的または連続的に使用することができます...

DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人-首席AI分享圈

DupDub:AI搭載ビデオエディター|ダビング|ビデオ翻訳|フォトデジタイザー

概要 Dupdubは、ユーザーの創造性をサポートする様々なAIツールを提供する、サイドヘビーポッドキャストおよびビデオプレゼンテーション作成プラットフォームです。テキストから動画への変換、AIによる音声や動画の吹き替えサービス、動画編集、文字起こし、字幕作成などの機能を提供しています。 Dupdubは再びOutdoor...

通义听悟:阿里通义音视频内容转录AI助手-首席AI分享圈

Tongyi Listening and Understanding: Ali Tongyi 音声・動画コンテンツ書き起こしAIアシスタント

総合紹介 Tongyi Listening and Understandingは、Aliyunが発表した、音声や動画コンテンツの書き起こしや分析に特化した作業学習AIアシスタントです。AliCloudの強力なAIモデルを利用して、音声や動画コンテンツをリアルタイムでテキストに書き起こし、翻訳、要約、位置決めなどの機能を提供します。Tongyi Listening Wooは、複数の言語とシナリオをサポートしています...

Insanely Fast Whisper: 高速で効率的な音声テキスト化オープンソースプロジェクト

一般的な説明 insanely-fast-whisperは、OpenAIのWhisperモデルと様々な最適化技術(Transformers、Optimum、Flash Attentionなど)を組み合わせた音声書き起こしツールで、大量の音声を迅速かつ効率的に書き起こすために設計されたコマンドラインインターフェース(CLI)を提供します。このCLIは、Whisperモデルを使用しています。

Memo AI:视频转字幕、转换多语言字幕的本地客户端-首席AI分享圈

Memo AI: 動画から字幕へのネイティブクライアント、多言語字幕の変換

概要 MemoAIは、ビデオやオーディオファイルをテキスト、字幕、メモに変換するために設計された強力なビデオ翻訳ツールです。YouTubeの動画、ポッドキャスト、ローカルファイルなど、MemoAIなら簡単に扱うことができます。中国語、英語、日本語など、90以上の言語の書き起こしや翻訳をサポートしています。

pyvideotrans:视频翻译配音工具-首席AI分享圈

pyvideotrans:動画翻訳ダビングツール

pyVideoTrans 概要 pyvideotransはビデオ翻訳ダビングツールです。ユーザーはビデオコンテンツをある言語から別の言語に翻訳し、対応するボイスオーバーと字幕をビデオに追加することができます。openai-whisperオフラインモデルに基づいており、様々な翻訳・音声合成サービスをサポートしています。

ja日本語