AIパーソナル・ラーニング
と実践的なガイダンス
讯飞绘镜
全45記事

タグ: AI 音声合成 2ページ目

BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳-首席AI分享圈

BetterWhisperX:話者から切り離された自動音声認識により、高精度の単語レベルのタイムスタンプを提供

概要 BetterWhisperXは、効率的で正確な自動音声認識(ASR)サービスを提供することに重点を置いたWhisperXプロジェクトの最適化バージョンです。WhisperXの改良版として、このプロジェクトはFederico Torrielliによって管理されており、プロジェクトの継続的な更新とパフォーマンスの向上に努めています。

Freed:AI医疗抄写助手,准确转录医生和患者对话,减少就诊记录文书工作-首席AI分享圈

フリード:医師と患者の会話を正確に書き起こし、診察記録の事務作業を軽減するAI医療記録アシスタント

概要 Freedは、医療従事者向けに設計されたAI医療記録アシスタントです。医師やその他の医療従事者が、高度なAI技術によって患者の診察記録を自動化し、ペーパーワークを削減し、生産性を向上させることを支援します。FreedのAIテープ起こしアシスタントは、リアルタイムで聞き取り、...

Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装-首席AI分享圈

Voice-Pro: オープンソースの多機能ビデオ翻訳ツール、多言語への音声書き起こしおよび翻訳、Windowsワンクリックインストール

概論 Voice-Proは、Gradio WebUIをベースとした、音声合成、テキスト読み上げ、リアルタイム翻訳、YouTubeビデオダウンロード、人声分離をサポートする多機能ツールです。Whisper、Faster-Whisper、Whisper-Timestamped技術を統合し、効率的な音声翻訳を提供します。

Zamzar:多功能在线文件格式转换工具,视频转换|音频转换|图片转换|文档转换-首席AI分享圈

Zamzar: 多機能オンラインファイル形式変換ツール, 動画変換, 音声変換, 画像変換, 文書変換

概要 Zamzarは、1200以上のファイル形式をサポートする強力なオンラインファイル変換ツールです。文書、写真、ビデオ、オーディオ、電子ブックなど、Zamzarは迅速かつ効率的に変換できます。ユーザーはソフトウェアをダウンロードする必要がなく、テキストを選択するだけです...

AI Hear:本地离线运行的实时语音转录与翻译软件-首席AI分享圈

AI Hear:オフラインでネイティブに動作するリアルタイム音声書き起こし・翻訳ソフトウェア

概要 MacBookをお使いの方は、AI Hearをお試しください。音声を録音し、リアルタイムで現地の音声をテキストに変換し、翻訳し、最終的には字幕を書き出すことができます。国をまたいだ会議や英語のオーディオブックのリスニングをサポートします。 AI Hearは、ワンクリックでリアルタイムの翻訳と文字起こしができ、複数の音声をサポートする、ローカルで動作するソフトウェアです。

SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声-首席AI分享圈

SoniTranslate: オープンソース動画翻訳ダビングソリューション、複数ダビング、速度調整、オリジナルサウンドの模倣

概要 SoniTranslate はパワフルでユーザーフレンドリーなビデオ多言語ダビングツールです。高度な音声認識と機械翻訳技術により、ビデオコンテンツを多言語に翻訳し、音声を同期させます。このプロジェクトは、Gradi...

FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别-首席AI分享圈

FunASR: オープンソース音声認識ツールキット、話者分離/多人数対話音声認識

総合紹介 FunASRは、学術研究と産業アプリケーションの橋渡しをするために、アリババのDharma Instituteによって開発されたオープンソースの音声認識ツールキットです。音声認識(ASR)、音声終点検出(VAD)、句読点復元、言語モデリング、話者検証、発話...など、幅広い音声認識機能をサポートしています。

AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端-首席AI分享圈

AsrTools:音声字幕ツール、Cutscene、Racer、Must-Cutへのインターフェースを内蔵した軽量クライアント

包括的な紹介 AsrTools は、Cutscene, Racer, Must Cut などの大手のインターフェースを内蔵したインテリジェントな音声テキスト変換ツールです。GPU や面倒な設定を必要とせず、効率的なマルチスレッドバッチ処理をサポートします。PyQt5をベースに開発されており、美しくユーザーフレンドリーなインターフェイスで、SRTやTXT形式の字幕ファイルを出力できます。このツールは...

Happy Scribe:音频转录和视频字幕平台|免费视频字幕编辑软件-首席AI分享圈

ハッピースクライブ:音声書き起こし・ビデオ字幕作成プラットフォーム|無料ビデオ字幕作成ソフト

ハッピースクライブ概要 ハッピースクライブは、高精度で音声をテキストに変換し、複数の言語とフォーマットをサポートする、自動および手動の音声書き起こしサービスを提供します。インタラクティブエディタ、コラボレーションツール、複数のエクスポートフォーマット、機械翻訳などが含まれています。このプラットフォームは、安全で信頼できるものです。

Whisper GPGPU:运行在Windows的OpenAI Whisper|Whisperdesktop-首席AI分享圈

Whisper GPGPU: Windows上で動作するOpenAI Whisper|Whisperdesktop

概要 WhisperはConst-meによって開発されたGitHubのオープンソースプロジェクトで、GPGPUを使用したOpenAIのWhisper自動音声認識(ASR)モデルの高性能推論に焦点を当てています。このプロジェクトはMPL-2.0ライセンスの下でリリースされており、最新のバージョン1.12は2023年7月22日にリリースされた。その代わりに...

Buzz:开源离线音频转写翻译工具|IOS语音转录-首席AI分享圈

Buzz: オープンソースのオフライン音声書き起こし翻訳ツール|IOS音声書き起こし

Buzz 概要 Buzzはchidiwilliamsによって作成されたオープンソースプロジェクトで、パーソナルコンピュータ上でオフラインでの音声の書き起こしや翻訳を可能にする。このプロジェクトはOpenAIのWhisperテクノロジーに依存しており、ユーザーはインターネット接続に依存せずに音声ファイルの書き起こしや翻訳作業を行うことができる。GitHub経由で...

Murf AI:变声大师|语音转文本|文本生成语音|音频编辑器-首席AI分享圈

Murf AI: ボイスチェンジャー|音声テキスト|テキストから音声へ|音声エディター

包括的な紹介 Murf AI は、テキストをほぼ実生活に近い音声に変換する、強力なオンライン人工知能音声生成ツールです。最大120以上のAIボイスオプションを提供し、20以上の言語をサポートし、ポッドキャスト、ビデオ、プロフェッショナルなプレゼンテーションなど様々な場面に適しています。

VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具-首席AI分享圈

VideoLingo: 動画書き起こし単語レベルタイムライン字幕、動画字幕翻訳、ローカライズ吹き替えオープンソースツール

一般的な説明 VideoLingoはNetflixの等級を、発生させるように設計されているワンストップビデオ翻訳および局在化のダビング用具である 良質のサブタイトルは、未加工機械翻訳および複数行サブタイトルを除去し、世界的な知識が言語障壁を渡って共有されることを可能にするために良質のボイスオーバーを加える。直感的なStreamlit ...

ALog:便携AI语音日记应用,支持语音转文字。-首席AI分享圈

ALog:音声読み上げ機能付きの携帯型AI音声日記アプリ。

一般的な紹介 ALogはAIベースの音声日記アプリケーションで、ユーザーが音声で日常生活を記録できるように設計されています。duxinsによって開発され、GitHubでオープンソース化されています。ユーザーは音声入力で日記を記録することができ、アプリは自動的に音声をテキストに変換し、インテリジェントに分析します...

录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字-首席AI分享圈

Record Cafe: ワンストップ音声・映像処理プラットフォーム|動画生成|AI字幕|音声抽出|音声テキスト化

総合紹介 Record Cafeはワンストップの音声/動画処理プラットフォームで、AI動画対話、AI字幕、AI音声テキスト化サービスを提供する。画面録画、動画編集、GIF/音声変換などの機能があり、クラウドストレージや共有もサポートします。インターフェースは直感的で使いやすく、マルチスクリーン録画と多言語インテリジェント読み上げもサポートします。

Babelfish.ai:浏览器运行的语音实时转录与翻译应用-首席AI分享圈

Babelfish.ai:ブラウザで動作するリアルタイム音声書き起こし翻訳アプリケーション

概論 Babelfish.aiは、Huggingface Transformer.jsとSupabase Realtimeで構築されたリアルタイム音声翻訳アプリケーションです。このアプリケーションは、ブラウザで大きなモデルを読み込み、ローカルで実行することで、リアルタイムの音声読み上げと翻訳機能を実現します。ユーザーはシンプルな...

ja日本語