はじめに
Mahiloは、開発者Jayesh SharmaがGitHubで公開したオープンソースのマルチインテリジェンス統合プラットフォームで、ユーザが異なるフレームワークのAIインテリジェンスを接続して、リアルタイムコミュニケーション、人間とコンピュータのインタラクション、インテリジェントなコラボレーションをサポートできるように設計されている。このプラットフォームは、LangGraphやPydantic AIなどのフレームワークのインテリジェンスを統合したり、カスタムAPIを通じてインテリジェンスを追加したりするための共通インターフェースを提供する。音声とテキストによるインタラクションをサポートし、複数のユーザーが共有スペースでインテリジェンスとコラボレーションできる。Mahiloは、コンテンツ作成、緊急対応、不動産マッチングなどの多様なシナリオに適しています。Mahiloは、複雑な自動化タスクのソリューションを簡単に構築できる柔軟なツールとモジュールにより、マルチインテリジェント体システムの開発を簡素化します。
機能一覧
- 一般知能の統合LangGraph、Pydantic AI、またはBaseAgentインターフェイスを介したカスタム・インテリジェンスなどのフレームワークからのインテリジェンスへの接続をサポート。
- リアルタイム通信インテリジェンス間のインスタント音声およびテキストインタラクションのためのWebSocket接続を提供します。
- インテリジェント・コラボレーションインテリジェントは、AgentManagerを通じてコンテキストと情報を自律的に共有し、タスクの効率を向上させることができます。
- マルチユーザーサポート複数のユーザーがインテリジェント空間を共有し、リアルタイムでインテリジェンスとコラボレーションすることができます。
- 音声機能音声入出力のサポートにはPyAudioの追加インストールが必要です。
- 組織レベルの戦略行動とセキュリティのポリシーをインテリジェンス間で統一し、一貫性を確保する。
- 柔軟なアーキテクチャ複雑なマルチインテリジェント・ボディ・システムの構築をサポートし、複数のコミュニケーション・モードに適応する。
ヘルプの使用
設置プロセス
ローカルでMahiloを使用するには、以下のインストール手順を完了する必要があります:
- 環境要件
- Python 3.8以降をインストールする。
- GitHubリポジトリのクローン用にGitをインストールする。
- 音声機能が必要な場合は、PyAudioを用意する(インストール方法は後述)。
- クローン倉庫
ターミナルで以下のコマンドを実行し、マヒロコードを取得してください:
git clone https://github.com/wjayesh/mahilo.git
cd マヒロ
- 依存関係のインストール
プロジェクト・ディレクトリに移動し、コアの依存関係をインストールする:
pip install -r requirements.txt
音声サポートが必要な場合は、実行してください:
pip install "mahilo[voice]"
- PyAudioをインストールする。
- ウィンドウズ走る
pip install pyaudio
失敗した場合は、対応するバージョンの.whl
ファイルのインストール。 - マックオス最初にHomebrewをインストールする
portaudioをインストールする
を実行する。pip install pyaudio
. - リナックスシステムの依存関係をインストールする
sudo apt-get install portaudio19-dev
を実行する。pip install pyaudio
.
- サーバーの起動
インストールが完了したら、以下のコマンドを実行してWebSocketサーバーを起動する:
python -m mahilo.server
デフォルトは http://localhost:8000
アドレスとポートはコンフィギュレーション・ファイルで変更できる。
使用方法
Mahiloの使用は、インテリジェンス定義、サーバー操作、およびクライアント対話の3つの主要ステップに分けられます。以下は詳細な操作ガイドです:
1.インテリジェンスの定義と管理
- 基本的知性の創造使用
ベースエージェント
単純なインテリジェンス、例えばセールス・インテリジェンスを定義する:
from mahilo.agent import BaseAgent
from mahilo.agent_manager import AgentManager
sales_agent = BaseAgent(
type="sales_agent"、
description="Intelligent responsible for handling sales tasks"、
tools=["crm_tool"])
)
manager = AgentManager()
manager.register_agent(sales_agent)
- 外部フレーム・インテリジェンスの統合による ラングラフ 一例を挙げよう:
from mahilo.integrations.langgraph.agent import LangGraphAgent marketing_agent = LangGraphAgent( langgraph_agent=graph_builder、 name="MarketingAgent"、 description="マーケティング戦略インテリジェント" can_contact=["sales_agent"]) ) manager.register_agent(marketing_agent)
2.WebSocketサーバーを起動する
- スクリプトでサーバーを初期化して実行する:
from mahilo.server.import ServerManager server = ServerManager(manager) server.run()
- サーバーが起動すると、スマートはWebSocket経由でクライアント接続を受け付けることができる。
3.クライアントとの接続と相互作用
- テキスト相互作用以下のコマンドを実行して、インテリジェンスを接続する:
python client.py --エージェント名 sales_agent
接続に成功したら、テキストを入力してスマートボディと対話することができる。
- 音声対話追加
--声
パラメータで音声機能を有効にする:python client.py --エージェント名 sales_agent --声
システムはマイク入力を聞き、スピーカーから音声応答を返す。
4.マルチインテリジェンス・コラボレーション
- コンテキスト共有多重知能パス
エージェントマネージャー
対話のコンテキストを管理する。例えば、セールス・インテリジェンスがマーケティング・インテリジェンスに尋ねることがある:[sales_agent] 売上を伸ばすには? [marketing_agent] ソーシャルメディア広告を増やすことを提案します。
- マルチユーザーコラボレーション例えば、複数のクライアントが同時に接続できます:
python client.py --agent-name 買い手エージェント python client.py --エージェント名 seller_agent
ユーザーとインテリジェンスが共有スペースでリアルタイムに相互作用し、複数人でのコラボレーションシナリオをシミュレートすることができます。
5.実用例
- ストーリーウィーバー共同コンテンツ作成アプリケーションの実行
story_agent = BaseAgent(type="story_agent", description="ストーリー作成アシスタント") manager.register_agent(story_agent) server.run()
接続後、「冒険物語を始めよう」と入力すると、インテリジェンスがコンテンツを生成し、他のユーザーと共同作業を行う。
- 緊急対応コーディネーション例えば、情報を処理し、タスクを割り当てるために、複数の知能を作り出す:
emergency_agent = BaseAgent(type="emergency_agent", description="緊急対応調整")
- 不動産マッチングインテリジェント・ボディは、ユーザーのニーズに基づいてリスティングをマッチングし、提案を提供することができます。
6.デバッグと拡張機能
- ログビューインテリジェンス間の質問と回答などのコミュニケーションログは、サーバーの実行中に表示され、デバッグを容易にします。
- より多くのフレームワークをサポート現在、LangGraphとPydantic AIがサポートされています。 クルーAI インテグレーションは近日中に提供される予定で、ユーザーはGitHub経由でリクエストを提出できる。
- カスタムエクステンション参考
例
カタログのサンプルコードで素早くパーソナライズ。
ほら
- 安定したネットワーク接続を確保してください。WebSocketは遅延に敏感です。
- 音声機能を使用する前に、マイクとスピーカーが正常に動作することをテストしてください。
- 初めてお使いになる方は
例
基本的な機能に慣れるために、カタログの例を参照してください。