AIパーソナル・ラーニング
と実践的なガイダンス

TransRouter:Geminiマルチモーダルモデルに基づく中英翻訳用リアルタイム音声変換ツール

はじめに

TransRouterはGoogle ジェミニ TransRouterは、英語と中国語のリアルタイム音声翻訳に特化して設計された、大規模モデル向けのリアルタイム音声翻訳ツールです。Zoomなどのビデオ会議ソフトウェアにシームレスに統合されたTransRouterは、ストリーミング処理技術を採用し、翻訳プロセスにおける低遅延を保証し、自動音声合成機能を備えています。このシステムは、音声信号をリアルタイムで処理できるだけでなく、元の録音と合成された音声を自動的に保存し、後で確認したり録音したりすることもできる。このプロジェクトは完全にオープンソースで、Pythonで開発されており、拡張性とカスタマイズ性に優れている。


 

機能一覧

  • 中国語と英語の双方向リアルタイム音声翻訳を実現
  • Zoomなどの主要な会議ソフトウェアとのシームレスな統合をサポート
  • Google Geminiマクロモデルを使用した高品質の翻訳
  • 低レイテンシーのストリーミング・オーディオ処理を提供
  • 自動音声合成出力
  • オリジナル録音と翻訳音声の自動保存に対応
  • 完全な記録システムの提供
  • バーチャルオーディオデバイスのルーティングをサポート
  • 設定可能なオーディオ入出力パラメータ

 

ヘルプの使用

システム環境の準備

  1. 基本的な環境要件:
    • Python 3.8以上
    • macOS オペレーティングシステム
    • 安定したネットワーク接続
    • グーグル インターネット企業 ジェミニAPI キー
  2. オーディオデバイスの設定:
    • BlackHoleバーチャルオーディオデバイスをインストールします:
      brew install ブラックホール-2ch
      
    • システム環境設定でオーディオデバイスを設定する:
      • システム環境設定>サウンド」を開きます。
      • BlackHole 2chデバイスが正しく認識されていることを確認します。
      • デフォルトの入出力デバイスの設定

インストール手順

  1. クローン・プロジェクト・ウェアハウス
    ギット クローン https://github.com/notedit/TransRouter.git
    cd トランスルーター
    
  2. 仮想環境を作成し、起動する:
    python -m venv venv
    ソース venv/bin/activate  #マックOS
    
  3. 依存パッケージをインストールします:
    pip install -r requirements.txt
    
  4. 環境変数を設定する:
    • のコピーを取る。 .env.example ファイルは 環境
    • ある 環境 ファイルでGemini APIキーを設定します:
      GEMINI_API_KEY=your_gemini_api_key
      

ズーム設定ガイド

  1. ズーム設定パネルを開く
  2. オーディオ設定オプションに進む
  3. マイクをシステムのデフォルトデバイスに設定する
  4. スピーカーを "BlackHole 2ch "に設定する。

使用方法

  1. 手続きを開始する:
    python transrouter.py
    
  2. プログラムは自動的に実行される:
    • オーディオデバイスの初期化
    • Google Geminiへの接続を確立する
    • オーディオのキャプチャと処理を開始する
  3. 文書管理:
    • 録音ファイルは 記録 ディレクトリ
    • 合成された翻訳音声は シンセシス ディレクトリ
    • 実行時ログは 過去ログ ディレクトリ
  4. 運用管理:
    • プログラム実行中、リアルタイムのステータス情報が表示される
    • Ctrl+Cを押して、プログラムを安全に停止する。
    • 停止時にすべてのオーディオファイルを自動的に保存

障害解決

  1. オーディオ機器の問題:
    • BlackHoleが正しくインストールされ、設定されていることを確認する。
    • システムオーディオ設定でデバイス識別の状態を確認する
    • Zoomのオーディオ設定構成を確認する
  2. 翻訳の問題:
    • 安定したネットワーク接続の確認
    • APIキーが正しく設定されていることを確認する。
    • 詳細なエラーメッセージのログファイルを見る
無断転載を禁じます:チーフAIシェアリングサークル " TransRouter:Geminiマルチモーダルモデルに基づく中英翻訳用リアルタイム音声変換ツール

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語