AIパーソナル・ラーニング
と実践的なガイダンス

Whisperを使えば、あなたの声を無料で複数のフォーマットに書き起こせます!

Whisper+Google Colabを使って音声ファイルを無料でマルチフォーマットのテキストに書き起こそう-1

 


会議の録音やインタビューをテキストに書き起こす必要がよくありますか?逐語的な書き起こしには時間と労力がかかるため、AIツールを使って音声記録をテキストに変換したいと思うかもしれません。今回は、OpenAIチームが開発した自動音声認識(ASR)システム「Whisper」を紹介しよう。GithubにあるOpenAIの説明によると、Whisperはオープンソースの音声認識モデルで、現在世界中の約96の言語を認識し、テキストに変換している。中国語の認識精度に関しては、Whisperはかなり高いレベルに達している。その結果 ウィスパー オープンソース技術なので、必要なのはGoogleアカウントとセットアップのためのコマンドコードだけだ。一度ダウンロードし、コンピュータにインストールすれば、開発者の制限なく、Whisperを使って音声認識やテープ起こし作業を無料で行うことができます。

 

ウィスパー・インストール・コード:!pip install git+https://github.com/openai/whisper.git

ffmpegのインストールコード:sudo apt update && sudo apt install ffmpeg

音声テキスト実行コード:!.whisper "ファイル名(置換が必要).mp3" -モデル medium

 

ステップ1:Googleアカウントにログインし、Googleドライブを開き、左上隅にある「+新規作成」をクリックし、スクロールダウンして「その他」を見つけ、「その他のアプリを接続」をクリックする。

Whisper AIを使って逐語原稿を簡単に仕上げるには?-1

ステップ2:初回はGoogle Workspaceアプリのマーケットプレイスが開くので、検索バーに「Google Colaboratory」と入力して選択する。

 

ステップ 3: インストールするには「Install」をクリックし、続けるには「Continue」を選択します。Googleアカウントでログインするよう求められますので、指示に従ってインストールを完了してください。

 

ステップ4:Googleドライブのホームページに戻り、左上にある「+新規」を再度クリックし、その他のオプションから「Google Colaboratory」アプリを選択する。

Whisper AIを使って逐語原稿を簡単に仕上げるには?-1

 

ステップ5:一度開いたファイル名は、後ですぐに参照したり再利用したりするために変更することができます。

Whisper AIを使って逐語原稿を簡単に仕上げるには?-1

 

ステップ 6: 上部の列の "Execution Phase" をクリックし、"Change Execution Phase Type" を選択します。

Whisper AIを使って逐語原稿を簡単に仕上げるには?-1

 

ステップ7:この時点で、異なるランタイプと計算リソースを選択することができます。Python 3 "と "T4 GPU "を選択し、"Save "をクリックしてください。

Whisper AIを使って逐語原稿を簡単に仕上げるには?-1

 

ステップ8:ウィンドウの右上にある「Connect」という文字を見つけ、それをクリックして接続が成功するのを待つ。

Whisper AIを使って逐語原稿を簡単に仕上げるには?-1

 

ステップ 9: 接続が完了すると、GPU、メモリ、ハードドライブ情報など、コンピュータのパラメータが表示されます。

Whisper AIを使って逐語原稿を簡単に仕上げるには?-1

 

ステップ 10: 次に、Whisperをインストールするために、Whisperインストールコードとffmpegインストールコードをそれぞれ真ん中のバーの1行目と2行目に入力し、「実行」をクリックします。

Whisper AIを使って逐語原稿を簡単に仕上げるには?-1

 

ステップ11:インストールが完了したら、左側のフォルダアイコンをクリックして、「ファイルをアップロード」を選択し、書き起こしたいMP3ファイルをアップロードします。

Whisper AIを使って逐語原稿を簡単に仕上げるには?-1

 

ステップ 12: "+Code "をクリックし、音声テキスト実行コードを入力します。ファイル名と接尾辞がアップロードしたファイルと同じであることを確認し、最後に「実行」をクリックします。

Whisper AIを使って逐語原稿を簡単に仕上げるには?-1

無断転載を禁じます:チーフAIシェアリングサークル " Whisperを使えば、あなたの声を無料で複数のフォーマットに書き起こせます!

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語