AIパーソナル・ラーニング
と実践的なガイダンス
TRAE

Vexa:リアルタイム会議記録・インテリジェント知識抽出ツール

はじめに

Vexaはオープンソースのリアルタイム会議記録・知識管理プラットフォームで、企業や個人向けに効率的な会議記録とインテリジェントな知識抽出サービスを提供するように設計されています。Vexaはマイクロサービス・アーキテクチャを採用しており、拡張性が高く、大量の同時書き起こしタスクの処理に適している。Vexaはマイクロサービス・アーキテクチャを採用しており、拡張性が高く、大量の同時テープ起こしタスクを処理するのに適している。現在クローズドベータ中で、公式ウェブサイトから無料で入手できる。Vexaは、recall.aiに代わるエンタープライズグレードのサービスを目指し、高いパフォーマンスと豊富な機能を兼ね備えている。

Vexa: リアルタイム会議記録およびインテリジェント知識抽出ツール-1


 

機能一覧

  • 会議のリアルタイム文字起こしGoogle Meet、Zoom、Microsoft Teamsの会議に自動的に参加し、リアルタイムで音声をテキストに書き起こします。
  • 多言語サポートグローバルチーム向けに99言語でのテープ起こしをサポート。
  • 会議用ロボットAPI経由でボットを制御して会議に参加させることで、業務を簡素化。
  • 知識抽出RAG(Retrieval Augmented Generation:検索拡張ジェネレーション)技術を使って、トランスクリプトから重要な情報を抽出し、検索可能な知識ベースを生成する。
  • 企業セキュリティローカルな展開をサポートし、データのプライバシーを保護し、コンプライアンスのニーズを満たします。
  • 高い拡張性マイクロサービス・アーキテクチャにより、同時多発的なテープ起こし作業をサポート。
  • ダイレクト・ストリーミングウェブページやモバイルアプリからの直接オーディオキャプチャをサポート(開発中)。
  • オープンソース貢献開発者はGitHubを通じて開発に参加し、機能を拡張することができます。

 

ヘルプの使用

インストールと展開

Vexaは、技術力のあるユーザーや企業によるローカル展開に適したオープンソースプロジェクトです。以下は詳細なインストール手順です:

  1. クローン倉庫
    ターミナルを開き、以下のコマンドを実行してVexaリポジトリをクローンします:

    git clone https://github.com/Vexa-ai/vexa.git
    cd vexa
    
  2. サブモジュールの初期化
    VexaはGitサブモジュールを使って依存関係を管理します(services/vexa-botやservices/WhisperLiveなど)。実行します:

    make submodules
    
  3. 環境変数の設定
    環境設定ファイルを作成し、編集する:

    make env
    

    .envファイルにADMIN_API_TOKEN(管理者APIキー)などのパラメータを設定する。を調整する。 ウィスパー モデルパスまたはデータベース構成。

  4. ウィスパーモデルのダウンロード
    Vexaは音声トランスクリプションにWhisperモデルを使用しています。次のコマンドを実行してください:

    make download-model
    

    モデルは ./hub ディレクトリに格納され、WhisperLive コンテナにマウントされる。

  5. 会議用ロボットミラーを作る
    Vexaロボット用のDockerイメージの構築:

    docker build -t vexa-bot:latest -f services/vexa-bot/core/Dockerfile ./services/vexa-bot/core
    
  6. サービス開始
    Docker Composeを使ってサービスをビルドし、実行する:

    docker compose build
    docker compose up -d
    

    サービス開始時、APIゲートウェイはhttp://localhost:8056、管理インターフェースはhttp://localhost:8057。

コア機能の操作

会議のリアルタイム文字起こし

Vexaの中核機能は、会議ロボットを介して会議の音声をリアルタイムで書き起こすことである。以下にその手順を説明する:

  1. APIキーのリクエスト
    https://api.dev.vexa.ai/pricing、クローズドテスト用のAPIキーをリクエストしてください。リクエストを送信した後、X-API-Keyを取得してください。
  2. ロボットを会議に参加させる
    APIリクエストを使用して、ボットをミーティングに参加させます。例えば、Google Meetに参加する:

    curl -X POST https://gateway.dev.vexa.ai/bots \
    -H "Content-Type: application/json" \
    -H "X-API-Key: YOUR_CLIENT_API_KEY" \
    -d '{"native_meeting_id": "xxx-xxxx-xxx", "platform": "google_meet"}'
    

    成功すると、meeting_idとロボットのステータスを含むJSONが返される。

  3. 転写データへのアクセス
    トランスクリプトを取得するには、セッションIDを使用します:

    curl -H "X-API-Key: YOUR_CLIENT_API_KEY" \
    https://gateway.dev.vexa.ai/transcripts/google_meet/xxx-xxxx-xxx
    

    例に戻る:

    {
    "data": {
    "meeting_id": "meet_abc123",
    "transcripts": [
    {"time": "00:01:15", "speaker": "John Smith", "text": "Let's discuss the quarterly results."},
    {"time": "00:01:23", "speaker": "Sarah Johnson", "text": "The Q3 revenue exceeded our projections by 15%."}
    ]
    }
    }
    

多言語サポート

Vexaは99言語のリアルタイム文字起こしに対応しています。セットアップ方法

  • .envファイルにLANGUAGE=jaのように言語を指定する。
  • APIリクエストに言語パラメータを追加する:
    curl -X POST -H "Content-Type: application/octet-stream" \
    -d '{"language": "es"}' \
    http://localhost:8033/
    

    システムは自動的に指定された言語で会議を書き起こします。

知識抽出

ベクサの ラグ トランスクリプトから重要な情報を抽出し、構造化された知識ベースを生成する機能:

  1. ナレッジベースを見る
    生成された知識項目は、管理インターフェース(http://localhost:8057)またはAPIを介してアクセスされる。
  2. 情報検索
    キーワードを使用してナレッジベースを検索すると、RAGは関連する議事録とコンテキストを返します。
  3. 輸出データ
    分析またはアーカイブ用に、API経由でナレッジ・エントリーをJSONまたはCSV形式にエクスポートします。

ダイレクト・ストリーミング(開発中)

ベクサは、ウェブやモバイル・アプリケーションから直接音声を取り込むことをサポートする予定である。ユーザーはSDKやAPIを介して音声ストリームをアップロードし、システムはそれをリアルタイムで書き起こす。この機能は2025年に稼動する予定である。

その他の機能

  • 企業セキュリティX-Admin-API-Keyを使用して保護された管理インターフェイスを使用して、ローカルに配置された分離されたデータ。企業は、コンプライアンスの必要性に基づいてアクセス権を設定できます。
  • 高い拡張性マイクロサービス・アーキテクチャが自動的にタスクを割り当てます。人手を介することなく、システムは何千もの同時書き起こしを処理できる。
  • 地域貢献: CONTRIBUTING.mdはhttps://github.com/Vexa-ai/vexa。開発者はDiscord (https://discord.gg/Ga9duGkVz9)でタスクについて議論したり、コードを提出したりできます。

ほら

  • ハードウェア要件16GBのRAMと4コアのCPUを搭載したNVIDIA GPU搭載サーバーを推奨します。
  • アップデート・メンテナンスgit pullとdocker compose up --buildを定期的に実行して、最新の機能を手に入れよう。
  • クローズドテストAPIアクセスにはキーが必要で、テスト枠の数には限りがあります。
  • 開発進捗状況スピーカー認識は開発中で、Microsoft TeamsとZoomのボットはそれぞれ2025年4月と5月に稼働する予定だ。

 

アプリケーションシナリオ

  1. 多国籍企業会議
    多国籍チームはVexaを使用して、多言語ミーティングの書き起こし、リアルタイムでの英語への翻訳、意思決定ポイントの抽出、検索可能なナレッジベースの生成を行い、グローバルなコラボレーションを容易に実現しています。
  2. プロジェクト管理
    開発チームは技術会議を記録し、Vexaはタスクの割り当てとタイムラインを抽出して、自動化されたレポートを作成し、手作業による照合を減らす。
  3. カスタマーサポートの最適化
    カスタマーサービス・チームは、顧客からの電話を書き起こし、一般的な問題と解決策を抽出し、対応スピードと一貫性を向上させるための知識ベースを構築する。
  4. 学術研究記録
    研究者はインタビューやワークショップを記録し、Vexaはその内容を書き起こして分析し、論文の執筆をサポートする構造化データを作成する。

 

品質保証

  1. Vexaがサポートしているプラットフォームは?
    現在サポートされているGoogle Meet、Microsoft Teams、Zoomのボットは2025年に稼働する予定だ。
  2. テストキーのリクエスト方法は?
    X-API-Keyの無料テストリクエストは、https://api.dev.vexa.ai/pricing。
  3. ローカル展開に必要なリソースは?
    NVIDIA GPU、最低16GB RAM、4コアCPUを搭載したサーバーを推奨。
  4. Vexaはリアルタイム翻訳をサポートしていますか?
    現在、99の言語がテープ起こしに対応しており、2025年にはリアルタイム翻訳が開始される予定だ。
  5. どうすれば開発に参加できますか?
    Discord (https://discord.gg/Ga9duGkVz9) に参加し、CONTRIBUTING.md をチェックして、Pull Request を提出してください。
無断転載を禁じます:チーフAIシェアリングサークル " Vexa:リアルタイム会議記録・インテリジェント知識抽出ツール
ja日本語