AIパーソナル・ラーニング
と実践的なガイダンス
サイバーナイフ用ドローイングミラー
全46記事

タグ: AI 音声合成

TwinMind:免费离线语音转录文字的APP-首席AI分享圈

TwinMind: 無料オフライン音声テキスト変換アプリ

TwinMindは、ThirdEar AI, Inc.が開発した「すべてを記憶するのを助ける」スマートツールです。会話、会議、講義をリアルタイムで録音、テキスト化でき、100以上の言語に対応、携帯電話をポケットに入れていてもオフラインで使用できる。ユーザーは自分でメモを取る必要はなく、TwinM...

Wispr Flow:用语音在任何应用中快速输入文字-首席AI分享圈

Wispr Flow: どんなアプリケーションでも音声で素早くテキスト入力

一般的な説明 Wispr Flowは、ユーザーがコンピュータで素早く文章を書くのを助ける音声対応テキスト入力ツールです。ユーザーが自然に話すだけで、Word、Slack、Gmailなどのあらゆるアプリケーションにテキストを入力できる「タイピングの3倍速い」体験を提供します。Wispr Flowは100...

Meeting:本地实时转录和生成会议纪要的开源客户端-首席AI分享圈

ミーティング:オープンソース・クライアントのローカル・リアルタイム文字起こしおよび議事録作成

一般的な紹介 Meeting Minutes(別名Meetily)は、Zackriya Solutionsによって開発されたフリーでオープンソースのAIミーティングアシスタントツールで、リアルタイムでミーティングの音声をキャプチャし、書き起こしテキストを生成し、自動的にミーティングのサマリーを抽出することに重点を置いています。このツールはすべてネイティブデバイス上で動作し、macOS ...

Local-NotebookLM:本地PDF生成语音播客的开源工具-首席AI分享圈

Local-NotebookLM: オープンソースツールの音声ポッドキャストを生成するローカルPDF

概要 Local-NotebookLMは、ローカルで動作するインテリジェントな文書処理とコンテンツ生成ツールを提供することを目的としたオープンソースプロジェクトです。Google NotebookLMにインスパイアされ、ユーザーがPDFやその他のドキュメントをポッドキャストやインタビュー、講義などの様々な出力形式に変換することを支援することに重点を置いています。

FireRedASR:多语言高精度语音识别开源模型-首席AI分享圈

FireRedASR:多言語高精度音声認識のためのオープンソースモデル

包括的な紹介 FireRedASRは、Little Red Book FireRedチームによって開発され、オープンソース化された音声認識モデルです。このプロジェクトは開発者や研究者のためにGitHubでホストされており、産業グレードの設計を提供し、北京語、中国語をサポートしています。

LLPlayer:生成实时字幕并双语翻译的视频播放器-首席AI分享圈

LLPlayer: 対訳付きリアルタイム字幕を生成するビデオプレーヤー

概要 LLPlayerは言語学習者のために設計されたオープンソースのメディアプレイヤーで、GitHubでホストされており、開発者のumlx5hによって作成されました。バイリンガル字幕表示、AI自動生成字幕、リアルタイム翻訳、単語検索など、様々な便利な機能を統合しています。

CapsWriter-Offline:PC端的语音输入和字幕转录工具-首席AI分享圈

CapsWriter-Offline:PC用音声入力・字幕書き起こしツール

一般的な紹介 CapsWriter-Offlineは、GitHubでホストされ、開発者HaujetZhaoによって構築されたPC用の音声入力および字幕書き起こしツールです。完全にオフラインで動作し、インターネット接続を必要とせず、音声をテキストに変換し、オーディオ/ビデオファイルを字幕に変換します。

Whisper Input:利用Groq免费且高速的语音转录文本服务-首席AI分享圈

ウィスパーインプット:Groqを使った無料・高速の音声テキスト起こしサービス

Whisper Inputは、Optionボタンを押すことで音声の録音を開始し、ボタンを離すことで録音を終了することができるオープンソースの音声翻訳ツールです。このツールは音声翻訳用にGroq Whisper Large V3 Turboモデルを呼び出し、1-2秒で高速フィードバックを提供することができます...

LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言-首席AI分享圈

LiberSonora:オーディオブック字幕抽出と多言語翻訳、オーディオブックの多言語書き起こし

一般的な紹介 LiberSonoraは、「自由な音」を意味し、インテリジェントな字幕抽出、AIタイトル生成、GPUアクセラレーションによる多言語翻訳をサポートする強力なAI対応オープンソースオーディオブックツールセットです。インテリジェントな字幕抽出、AIタイトル生成、多言語翻訳などをサポートし、GPUアクセラレーションのもとでバッチオフライン処理が可能です。LiberSonoraは、モジュール式のコンセプトで設計されています。

AudioNotes:快速提取音视频内容并生成结构化笔记-首席AI分享圈

AudioNotes: 音声とビデオコンテンツをすばやく抽出し、構造化されたノートを作成します。

AudioNotesは、FunASRとQwen2をベースにした、オーディオ/ビデオから構造化ノートへのシステムです。オーディオやビデオのコンテンツを素早く抽出し、構造化されたMarkdownノートを生成するための大きなモデルを呼び出すことができます。本システムは、複数の...

Orate:集成知名语音生成、语音转录与变声模型的统一API-首席AI分享圈

Orate:よく知られた音声生成、音声トランスクリプション、音声モデリングを統合する統一API

概要 Orateは音声生成と文字起こしに特化したAIツールキットです。Orateは、OpenAI、ElevenLabs、AssemblyAIなどの主要なAIプロバイダーとシームレスに統合する統一APIを提供し、ユーザーがリアルで人間のような音声を作成したり、音声をテキストに書き起こしたりするのを支援します。

RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别-首席AI分享圈

RealtimeSTT: Whisperをベースとした低遅延ストリーミング音声認識のためのリアルタイム音声テキスト変換ツール

はじめに RealtimeSTT は効率的で低レイテンシーのリアルタイム音声テキスト変換ライブラリです。Kolja Beigelによって開発され、高速で正確な音声テキスト変換を必要とするアプリケーションをサポートします。音声アシスタントをする場合でも、音声をテキストに変換する必要がある場合でも、...

Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成-首席AI分享圈

Sherpa-ONNX: ONNXRuntimeによるオフライン音声認識と合成

概要 sherpa-onnxは、Next-gen Kaldiチームによって開発されたオープンソースプロジェクトで、効率的なオフライン音声認識および音声合成ソリューションを提供します。Android、iOS、Raspberry Piなど様々なプラットフォームに対応し、ネットワーク接続がない環境でもリアルタイムに音声認識・音声合成を行うことができます。

Acoust:在线AI语音生成和文本转语音(TTS)服务平台-首席AI分享圈

Acoust: オンラインAI音声生成・音声合成(TTS)サービスプラットフォーム

Acoustは、最新のAI技術を使ってリアルな音声を生成するオンラインAI音声生成・音声合成(TTS)サービスプラットフォームです。このプラットフォームはまた、ユーザーが複数のソフトウェアを使用することなくビデオを作成できる強力なビデオ編集ツールも提供しています。

Notta:AI会议记录与音频转录工具,自动转录会议、采访或录音-首席AI分享圈

Notta: 会議、インタビュー、録音を自動的に書き起こすAI会議録音・音声書き起こしツール

はじめに Nottaは、会議、インタビュー、音声録音を検索可能なテキストに自動変換するために設計された、強力なAI会議録音・音声書き起こしツールです。Nottaを使用すると、ユーザーは簡単に書き起こし、編集、要約、共同作業を行うことができ、生産性が向上します。Nottaは58の言語での書き起こしをサポートしています...

ja日本語