AudioNotes: 音声とビデオコンテンツをすばやく抽出し、構造化されたノートを作成します。

40.5K 00

はじめに

AudioNotesは、FunASRとQwen2をベースとした、オーディオ/ビデオから構造化ノートへのシステムです。AudioNotesはFunASRとQwen2をベースにした構造化ノートシステムで、オーディオ/ビデオコンテンツを素早く抽出し、ビッグモデルを呼び出して構造化されたMarkdownノートを生成することができ、ユーザが読みやすく、情報を素早く見つけることができます。AudioNotesは、効率的なオーディオ/ビデオコンテンツの転写と整理機能を提供し、情報抽出とノート整理のプロセスを大幅に簡素化します。

機能一覧

オーディオおよびビデオコンテンツの抽出オーディオやビデオから素早くコンテンツを抽出。
ストラクチャー・ノート作成抽出されたコンテンツを構造化されたMarkdownノートに整理する。
複数の配備オプションDockerデプロイとローカルデプロイに対応。
大型モデル対応FunASRとQwen2に基づいて、効率的な転写と仕上げを提供します。
ユーザーフレンドリーなインターフェース使いやすいユーザーインターフェイスで、簡単に操作できます。

ヘルプの使用

設置プロセス

Dockerデプロイメント（推奨）

Docker Composeファイルをダウンロードする：

   curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml

Dockerサービスを開始する：

   docker-compose up

ローカルサービスにアクセスするには：ブラウザを開き、次のサイトにアクセスします。 http://localhost:15433/デフォルトのアカウントを使用したい場合は、デフォルトのアカウントを使用する必要があります。 admin およびパスワード admin ログイン docker-compose.yml (文書で修正）。

ローカル展開

PostgreSQLデータベースがインストールされていることを確認する。
仮想環境を作成し、起動する：

   conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes

プロジェクトをクローンし、依存関係をインストールする：

   git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt

環境変数の設定 .env.example ファイル名を .envをクリックし、関連するコンフィギュレーション情報を変更する。
サービスを開始する：

   chainlit run main.py

ローカルサービスにアクセスするには：ブラウザを開き、次のサイトにアクセスします。 http://localhost:8000/デフォルトのアカウントを使用したい場合は、デフォルトのアカウントを使用する必要があります。 admin およびパスワード admin ログイン .env (文書で修正）。

機能操作の流れ

オーディオおよびビデオコンテンツの抽出::
- オーディオファイルやビデオファイルをアップロードすると、システムが自動的にコンテンツを抽出します。
- 抽出されたコンテンツはインターフェイスに表示され、ユーザーが編集・調整できる。
構造化ノートの作成::
- 抽出されたコンテンツは、自動的に構造化されたMarkdownノートに整理される。
- ユーザーは、生成されたノートをダウンロードまたはコピーして、後で使用することができます。
大型モデル対応::
- このシステムは、FunASRとQwen2に基づいて効率的なトランスクリプションと照合を提供します。
- ユーザーは、コンテンツの抽出と整理のために異なるモデルを選択し、精度と効率を向上させることができます。