中国初のAI IDE インテリジェント・プログラミング・ソフトウェア 🚀体験への招待 Trae 中国語版ダウンロードDeepSeek-R1とDoubao-proは無制限で利用できる！

全53記事

タグ: AI 音声合成 2ページ目

Orate：よく知られた音声生成、音声トランスクリプション、音声モデリングを統合する統一API

概要 Orateは音声生成と文字起こしに特化したAIツールキットです。Orateは、OpenAI、ElevenLabs、AssemblyAIなどの主要なAIプロバイダーとシームレスに統合する統一APIを提供し、ユーザーがリアルで人間のような音声を作成したり、音声をテキストに書き起こしたりするのを支援します。

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具-首席AI分享圈

PengChengStarling: Whisper-Large v3より小型で高速な多言語音声テキスト変換ツール

包括的な紹介 PengChengStarling (PengCheng Labs)は、異なる言語の音声を対応するテキストに変換できる多言語自動音声認識(ASR)ツールです。このツールキットはicefallプロジェクトに基づいて開発され、データ処理、モデル学習、...

2025-01-30AIツール AIオープンソースプロジェクト AI音声合成

Trae中国語版ダウンロードへの最初の招待：登録後、DeepSeek-R1を無制限に使用できます！

ビルダーインテリジェントプログラミングモード、DeepSeek-R1とDeepSeek-V3の無制限の使用、海外版よりも滑らかな経験を有効にします。ただ、中国語のコマンドを入力し、プログラミングの知識はまた、独自のアプリケーションを書くためにゼロしきい値をすることはできません。

2025-04-26

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别-首席AI分享圈

RealtimeSTT: Whisperをベースとした低遅延ストリーミング音声認識のためのリアルタイム音声テキスト変換ツール

はじめに RealtimeSTT は効率的で低レイテンシーのリアルタイム音声テキスト変換ライブラリです。Kolja Beigelによって開発され、高速で正確な音声テキスト変換を必要とするアプリケーションをサポートします。音声アシスタントをする場合でも、音声をテキストに変換する必要がある場合でも、...

2025-01-18AIニュース AIオープンソースプロジェクト AI音声合成

Sherpa-ONNX：使用ONNXRuntime实现离线语音识别和合成-首席AI分享圈

Sherpa-ONNX: ONNXRuntimeによるオフライン音声認識と合成

概要 sherpa-onnxは、Next-gen Kaldiチームによって開発されたオープンソースプロジェクトで、効率的なオフライン音声認識および音声合成ソリューションを提供します。Android、iOS、Raspberry Piなど様々なプラットフォームに対応し、ネットワーク接続がない環境でもリアルタイムに音声認識・音声合成を行うことができます。

2025-01-16AIツール AIオープンソースプロジェクト AI音声合成 AI音声合成

Acoust: オンラインAI音声生成・音声合成（TTS）サービスプラットフォーム

Acoustは、最新のAI技術を使ってリアルな音声を生成するオンラインAI音声生成・音声合成（TTS）サービスプラットフォームです。このプラットフォームはまた、ユーザーが複数のソフトウェアを使用することなくビデオを作成できる強力なビデオ編集ツールも提供しています。

2025-01-10AIツール AI音声合成 AI音声合成

Notta：AI会议记录与音频转录工具，自动转录会议、采访或录音-首席AI分享圈

Notta: 会議、インタビュー、録音を自動的に書き起こすAI会議録音・音声書き起こしツール

はじめに Nottaは、会議、インタビュー、音声録音を検索可能なテキストに自動変換するために設計された、強力なAI会議録音・音声書き起こしツールです。Nottaを使用すると、ユーザーは簡単に書き起こし、編集、要約、共同作業を行うことができ、生産性が向上します。Nottaは58の言語での書き起こしをサポートしています...

2025-01-09AIツール AIテキストおよび音声/ビデオ要約ツール AI音声合成

AIの自作組：AIによる映像の多言語字幕の自動生成と翻訳

総合紹介 AIの字幕組は、動画字幕の自動抽出、文字起こし、翻訳機能を実現することに特化した、強力なコマンドライン動画字幕処理ツールです。このツールは、Whisper音声認識モデルやさまざまな翻訳バックエンド（Dee...

2025-01-06AIツール AIオープンソースプロジェクト AI翻訳 AI音声合成

FunClip：智能剪辑视频内容为短片，轻松实现精准视频片段提取/裁剪-首席AI分享圈

FunClip：ビデオコンテンツをショートフィルムにインテリジェントに編集。

包括的な紹介 FunClipは、アリババ達磨研究所のTONGYI Speech Labによって開発された、完全にオープンソースのローカライズされた自動ビデオ編集ツールです。このツールは、産業グレードのParaformer-Large音声認識モデルを統合しており、ビデオ内の音声コンテンツを正確に認識し、テキストに変換することができます。特別な機能...

2025-01-03AIツール AIオープンソースプロジェクト AI音声合成 AIオーディオ・ビデオ編集

BetterWhisperX：自动语音识别与说话人分离，提供高精度单词级时间戳-首席AI分享圈

BetterWhisperX：話者から切り離された自動音声認識により、高精度の単語レベルのタイムスタンプを提供

概要 BetterWhisperXは、効率的で正確な自動音声認識(ASR)サービスを提供することに重点を置いたWhisperXプロジェクトの最適化バージョンです。WhisperXの改良版として、このプロジェクトはFederico Torrielliによって管理されており、プロジェクトの継続的な更新とパフォーマンスの向上に努めています。

2024-12-29AIツール AIオープンソースプロジェクト AI音声合成

Freed：AI医疗抄写助手，准确转录医生和患者对话，减少就诊记录文书工作-首席AI分享圈

フリード：医師と患者の会話を正確に書き起こし、診察記録の事務作業を軽減するAI医療記録アシスタント

概要 Freedは、医療従事者向けに設計されたAI医療記録アシスタントです。医師やその他の医療従事者が、高度なAI技術によって患者の診察記録を自動化し、ペーパーワークを削減し、生産性を向上させることを支援します。FreedのAIテープ起こしアシスタントは、リアルタイムで聞き取り、...

2024-12-27AIツール AI音声合成

Voicenotes：AI语音笔记，记录与转录语音，智能管理会议内容-首席AI分享圈

Voicenotes：AI音声メモ、音声録音・書き起こし、会議内容のインテリジェント管理

一般的な紹介 Voicenotesは、ユーザーが簡単に音声メモや会議を記録し、管理するために設計されたスマートな音声メモアプリです。ユーザーは自分の考えを話すだけで、Voicenotesが自動的にテキストに書き起こします。学生でも、プロフェッショナルでも...

2024-12-25AIツール AIノート AI音声合成

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装-首席AI分享圈

Voice-Pro: オープンソースの多機能ビデオ翻訳ツール、多言語への音声書き起こしおよび翻訳、Windowsワンクリックインストール

概論 Voice-Proは、Gradio WebUIをベースとした、音声合成、テキスト読み上げ、リアルタイム翻訳、YouTubeビデオダウンロード、人声分離をサポートする多機能ツールです。Whisper、Faster-Whisper、Whisper-Timestamped技術を統合し、効率的な音声翻訳を提供します。

2024-11-24AIツール AIオープンソースプロジェクト AI翻訳 AI音声合成

Zamzar：多功能在线文件格式转换工具，视频转换|音频转换|图片转换|文档转换-首席AI分享圈

Zamzar: 多機能オンラインファイル形式変換ツール, 動画変換, 音声変換, 画像変換, 文書変換

概要 Zamzarは、1200以上のファイル形式をサポートする強力なオンラインファイル変換ツールです。文書、写真、ビデオ、オーディオ、電子ブックなど、Zamzarは迅速かつ効率的に変換できます。ユーザーはソフトウェアをダウンロードする必要がなく、テキストを選択するだけです...

2024-11-04AIツール AIオープンサービス AI音声合成

AI Hear：オフラインでネイティブに動作するリアルタイム音声書き起こし・翻訳ソフトウェア

概要 MacBookをお使いの方は、AI Hearをお試しください。音声を録音し、リアルタイムで現地の音声をテキストに変換し、翻訳し、最終的には字幕を書き出すことができます。国をまたいだ会議や英語のオーディオブックのリスニングをサポートします。 AI Hearは、ワンクリックでリアルタイムの翻訳と文字起こしができ、複数の音声をサポートする、ローカルで動作するソフトウェアです。

2024-11-03AIツール AI翻訳 AI音声合成

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声-首席AI分享圈

SoniTranslate: オープンソース動画翻訳ダビングソリューション、複数ダビング、速度調整、オリジナルサウンドの模倣

概要 SoniTranslate はパワフルでユーザーフレンドリーなビデオ多言語ダビングツールです。高度な音声認識と機械翻訳技術により、ビデオコンテンツを多言語に翻訳し、音声を同期させます。このプロジェクトは、Gradi...

2024-10-27AIツール AI音声合成 AI翻訳 AI音声合成

FunASR：开源语音识别工具包，说话人分离/ 多人对话语音识别-首席AI分享圈

FunASR: オープンソース音声認識ツールキット、話者分離/多人数対話音声認識

総合紹介 FunASRは、学術研究と産業アプリケーションの橋渡しをするために、アリババのDharma Instituteによって開発されたオープンソースの音声認識ツールキットです。音声認識(ASR)、音声終点検出(VAD)、句読点復元、言語モデリング、話者検証、発話...など、幅広い音声認識機能をサポートしています。

2024-10-16AIツール AIオープンソースプロジェクト AI音声合成

AsrTools：语音转字幕工具，内置剪映、快手、必剪接口的轻量客户端-首席AI分享圈

AsrTools：音声字幕ツール、Cutscene、Racer、Must-Cutへのインターフェースを内蔵した軽量クライアント

包括的な紹介 AsrTools は、Cutscene, Racer, Must Cut などの大手のインターフェースを内蔵したインテリジェントな音声テキスト変換ツールです。GPU や面倒な設定を必要とせず、効率的なマルチスレッドバッチ処理をサポートします。PyQt5をベースに開発されており、美しくユーザーフレンドリーなインターフェイスで、SRTやTXT形式の字幕ファイルを出力できます。このツールは...

2024-10-14AIツール AIオープンソースプロジェクト AI音声合成

Happy Scribe：音频转录和视频字幕平台|免费视频字幕编辑软件-首席AI分享圈

ハッピースクライブ：音声書き起こし・ビデオ字幕作成プラットフォーム｜無料ビデオ字幕作成ソフト

ハッピースクライブ概要ハッピースクライブは、高精度で音声をテキストに変換し、複数の言語とフォーマットをサポートする、自動および手動の音声書き起こしサービスを提供します。インタラクティブエディタ、コラボレーションツール、複数のエクスポートフォーマット、機械翻訳などが含まれています。このプラットフォームは、安全で信頼できるものです。

2024-10-09AIツール AI音声合成 AIオーディオ・ビデオ編集

Whisper GPGPU：运行在Windows的OpenAI Whisper|Whisperdesktop-首席AI分享圈

Whisper GPGPU: Windows上で動作するOpenAI Whisper|Whisperdesktop

概要 WhisperはConst-meによって開発されたGitHubのオープンソースプロジェクトで、GPGPUを使用したOpenAIのWhisper自動音声認識（ASR）モデルの高性能推論に焦点を当てています。このプロジェクトはMPL-2.0ライセンスの下でリリースされており、最新のバージョン1.12は2023年7月22日にリリースされた。その代わりに...

2024-10-09AIツール AI音声合成

前ページ
1
2
3
次ページ
全3ページ