はじめに
AudioNotesは、FunASRとQwen2をベースとした、オーディオ/ビデオから構造化ノートへのシステムです。AudioNotesはFunASRとQwen2をベースにした構造化ノートシステムで、オーディオ/ビデオコンテンツを素早く抽出し、ビッグモデルを呼び出して構造化されたMarkdownノートを生成することができ、ユーザが読みやすく、情報を素早く見つけることができます。AudioNotesは、効率的なオーディオ/ビデオコンテンツの転写と整理機能を提供し、情報抽出とノート整理のプロセスを大幅に簡素化します。
機能一覧
- オーディオおよびビデオコンテンツの抽出オーディオやビデオから素早くコンテンツを抽出。
- ストラクチャー・ノート作成抽出されたコンテンツを構造化されたMarkdownノートに整理する。
- 複数の配備オプションDockerデプロイとローカルデプロイに対応。
- 大型モデル対応FunASRとQwen2に基づいて、効率的な転写と仕上げを提供します。
- ユーザーフレンドリーなインターフェース使いやすいユーザーインターフェイスで、簡単に操作できます。
ヘルプの使用
設置プロセス
Dockerデプロイメント(推奨)
- Docker Composeファイルをダウンロードする:
curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
- Dockerサービスを開始する:
docker-compose up
- ローカルサービスにアクセスするには: ブラウザを開き、次のサイトにアクセスします。
http://localhost:15433/
デフォルトのアカウントを使用したい場合は、デフォルトのアカウントを使用する必要があります。管理者
およびパスワード管理者
ログインdocker-compose.yml
(文書で修正)。
ローカル展開
- PostgreSQLデータベースがインストールされていることを確認する。
- 仮想環境を作成し、起動する:
conda create -n AudioNotes python=3.10 -y
condaはAudioNotesをアクティブにする
- プロジェクトをクローンし、依存関係をインストールする:
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt
- 環境変数の設定
.env.example
ファイル名を環境
をクリックし、関連するコンフィギュレーション情報を変更する。 - サービスを開始する:
chainlit run main.py
- ローカルサービスにアクセスするには: ブラウザを開き、次のサイトにアクセスします。
http://localhost:8000/
デフォルトのアカウントを使用したい場合は、デフォルトのアカウントを使用する必要があります。管理者
およびパスワード管理者
ログイン環境
(文書で修正)。
機能 操作の流れ
- オーディオおよびビデオコンテンツの抽出::
- オーディオファイルやビデオファイルをアップロードすると、システムが自動的にコンテンツを抽出します。
- 抽出されたコンテンツはインターフェイスに表示され、ユーザーが編集・調整できる。
- 構造化ノートの作成::
- 抽出されたコンテンツは、自動的に構造化されたMarkdownノートに整理される。
- ユーザーは、生成されたノートをダウンロードまたはコピーして、後で使用することができます。
- 大型モデル対応::
- このシステムは、FunASRとQwen2に基づいて効率的なトランスクリプションと照合を提供します。
- ユーザーは、コンテンツの抽出と整理のために異なるモデルを選択し、精度と効率を向上させることができます。