はじめに
WhisperはConst-meによって開発されたGitHubのオープンソースプロジェクトで、GPGPUを使用したOpenAIのWhisper自動音声認識(ASR)モデルの高性能推論に焦点を当てています。このプロジェクトはMPL-2.0ライセンスの下でリリースされており、最新のバージョン1.12は2023年7月22日にリリースされました。コードに関しては、主にC++で書かれていますが、C、C#、HLSLなどの他の言語も含まれています。
従属言語モジュールのダウンロード: https://huggingface.co/ggerganov/whisper.cpp/tree/main
機能一覧
OpenAI Whisperモデルに高性能GPGPU推論を提供する
最新のASRテクノロジーに対応
信頼できるオープンソースコミュニティからのソース
豊富な開発言語タイプとバージョン履歴を含む
ヘルプの使用
このリポジトリの「リリース」セクションからWhisperDesktop.zipをダウンロードし、ZIPファイルを解凍してWhisperDesktop.exeを実行してください。
最初の画面で、モデルをダウンロードするかどうか尋ねられます。
ggml-medium.bin(サイズ1.42GB)は、私がソフトウェアのテストによく使うモデルなので、これを使うことをお勧めする。
ソースコードとドキュメントはGitHubプロジェクトをご覧ください。
Readmeに従ったプロジェクトの展開と使用
MPL-2.0ライセンス仕様に従った改変と配布
GitHubを通じて、最新バージョンのアップデートとディスカッションを追跡する。
Whisper GPGPUクライアントのダウンロード