Allgemeine Einführung
Mahilo ist eine quelloffene Multi-Intelligenz-Integrationsplattform, die der Entwickler Jayesh Sharma auf GitHub veröffentlicht hat. Sie soll Nutzern helfen, KI-Intelligenzen aus verschiedenen Frameworks zu verbinden, um Echtzeitkommunikation, Mensch-Computer-Interaktion und intelligente Zusammenarbeit zu unterstützen. Die Plattform bietet eine einheitliche Schnittstelle zur Integration von Intelligenzen aus Frameworks wie LangGraph und Pydantic AI oder zum Hinzufügen von Intelligenzen über benutzerdefinierte APIs. Sie unterstützt Sprach- und Textinteraktionen und ermöglicht es mehreren Nutzern, mit Intelligenzen in einem gemeinsamen Raum zusammenzuarbeiten. Mit mehr als 50 Sternen auf GitHub und mehr als 500 PyPI-Downloads pro Monat (Stand: März 2025) eignet sich Mahilo für verschiedene Szenarien wie die Erstellung von Inhalten, die Reaktion auf Notfälle, den Abgleich von Immobilien usw. Mahilo vereinfacht die Entwicklung von multi-intelligenten Körpersystemen mit flexiblen Werkzeugen und Modulen, die es leicht machen, Lösungen für komplexe automatisierte Aufgaben zu erstellen.
Funktionsliste
- Integration der allgemeinen IntelligenzUnterstützung für die Verbindung mit Intelligenzen aus Frameworks wie LangGraph, Pydantic AI oder benutzerdefinierten Intelligenzen über die BaseAgent-Schnittstelle.
- EchtzeitkommunikationBietet eine WebSocket-Verbindung für sofortige Sprach- und Textinteraktion zwischen Intelligenzen.
- Intelligente ZusammenarbeitIntelligente Systeme können über den AgentManager selbstständig Kontext und Informationen austauschen, um die Effizienz ihrer Aufgaben zu verbessern.
- Unterstützung für mehrere BenutzerErmöglicht mehreren Benutzern die Zusammenarbeit mit Intelligenzen in Echtzeit in einem gemeinsamen intelligenten Raum.
- SprachfunktionUnterstützung für Spracheingabe und -ausgabe erfordert eine zusätzliche Installation von PyAudio.
- Strategie auf organisatorischer EbeneVerhaltens- und Sicherheitsrichtlinien einheitlich für alle Intelligenzen durchsetzen, um Konsistenz zu gewährleisten.
- Flexible ArchitekturUnterstützung des Aufbaus komplexer multi-intelligenter Körpersysteme und Anpassung an mehrere Kommunikationsmodi.
Hilfe verwenden
Einbauverfahren
Um Mahilo lokal zu nutzen, müssen Sie die folgenden Installationsschritte durchführen:
- Anforderungen an die Umwelt
- Installieren Sie Python 3.8 oder höher.
- Installieren Sie Git zum Klonen von GitHub-Repositories.
- Wenn Sie Sprachfunktionen benötigen, bereiten Sie PyAudio vor (siehe unten zur Installation).
- Klon-Lager
Führen Sie den folgenden Befehl in einem Terminal aus, um den Mahilo-Code zu erhalten:
git clone https://github.com/wjayesh/mahilo.git
cd mahilo
- Installation von Abhängigkeiten
Wechseln Sie in das Projektverzeichnis und installieren Sie die Kernabhängigkeiten:
pip install -r requirements.txt
Wenn Sprachunterstützung erforderlich ist, führen Sie diese aus:
pip install "mahilo[voice]"
- PyAudio installieren (sprachaktivierte Abhängigkeiten)
- Windows (Computer): Lauf
pip install pyaudio
Wenn dies nicht gelingt, können Sie die entsprechende Version von.whl
Datei-Installation. - MacOS: Installieren Sie zuerst Homebrew (
brew install portaudio
), dann führen Siepip install pyaudio
. - LinuxSystemabhängigkeiten installieren (
sudo apt-get install portaudio19-dev
), dann führen Siepip install pyaudio
.
- Starten Sie den Server
Nachdem die Installation abgeschlossen ist, führen Sie den folgenden Befehl aus, um den WebSocket-Server zu starten:
python -m mahilo.server
Die Standardeinstellung ist die Ausführung im http://localhost:8000
Die Adresse und der Port können über die Konfigurationsdatei geändert werden.
Wie zu verwenden
Die Nutzung von Mahilo gliedert sich in drei Hauptschritte: Definition der Intelligenz, Serverbetrieb und Client-Interaktion. Im Folgenden finden Sie eine detaillierte Anleitung zur Bedienung:
1. die Definition und Verwaltung von Intelligenzen
- Grundlegende Intelligenz schaffen: Verwendung
BaseAgent
Definieren Sie eine einfache Intelligenz, z. B. eine Vertriebsintelligenz:
from mahilo.agent import BaseAgent
from mahilo.agent_manager import AgentManager
sales_agent = BaseAgent(
type="sales_agent",
description="负责处理销售任务的智能体",
tools=["crm_tool"]
)
manager = AgentManager()
manager.register_agent(sales_agent)
- Integration von externen Rahmenintelligenzen: von LangGraph Ein Beispiel:
from mahilo.integrations.langgraph.agent import LangGraphAgent marketing_agent = LangGraphAgent( langgraph_agent=graph_builder, name="MarketingAgent", description="营销策略智能体", can_contact=["sales_agent"] ) manager.register_agent(marketing_agent)
2. starten Sie den WebSocket-Server
- Initialisieren und starten Sie den Server in einem Skript:
from mahilo.server import ServerManager server = ServerManager(manager) server.run()
- Sobald der Server gestartet ist, kann der smart Client-Verbindungen über WebSocket annehmen.
3. die Verbindung und Interaktion mit dem Kunden
- Textinteraktion: Führen Sie den folgenden Befehl aus, um die Intelligenzen zu verbinden:
python client.py --agent-name sales_agent
Nach erfolgreicher Verbindung geben Sie einen Text ein, um einen Dialog mit dem Smart Body zu führen, z. B. "Wie kann ich den Umsatz steigern?"
- Sprachinteraktion: Hinzufügen
--voice
um die Sprachfunktion zu aktivieren:python client.py --agent-name sales_agent --voice
Das System hört auf die Mikrofoneingabe und gibt eine Sprachantwort über den Lautsprecher.
4. die Zusammenarbeit zwischen mehreren Geheimdiensten
- KontextfreigabeMultiple Intelligenz: Pass
AgentManager
Verwaltung des Dialogkontexts. Zum Beispiel kann eine Sales Intelligence eine Marketing Intelligence fragen:[sales_agent] 如何提高销量? [marketing_agent] 建议增加社交媒体广告投放。
- Multi-User-ZusammenarbeitMehrere Clients können gleichzeitig eine Verbindung herstellen, zum Beispiel:
python client.py --agent-name buyer_agent python client.py --agent-name seller_agent
Benutzer und Intelligenzen können in Echtzeit in einem gemeinsamen Raum interagieren, um Szenarien der Zusammenarbeit mehrerer Personen zu simulieren.
5 Beispiele für praktische Anwendungen
- Geschichtenweber: Führen Sie Anwendungen zur kollaborativen Erstellung von Inhalten aus:
story_agent = BaseAgent(type="story_agent", description="故事创作助手") manager.register_agent(story_agent) server.run()
Sobald die Verbindung hergestellt ist, geben Sie "Starte eine Abenteuergeschichte" ein und die Intelligenz wird Inhalte erstellen und mit anderen Nutzern zusammenarbeiten.
- Koordinierung der NotfallmaßnahmenMultiple Intelligenzen schaffen, um z. B. Informationen zu verarbeiten und Aufgaben zu verteilen:
emergency_agent = BaseAgent(type="emergency_agent", description="紧急响应协调")
- Immobilien-MatchingIntelligente Einrichtungen können Angebote abgleichen und Vorschläge auf der Grundlage der Bedürfnisse der Nutzer machen.
6. debugging und Erweiterungen
- Log-AnsichtKommunikationsprotokolle, wie z.B. Fragen und Antworten zwischen Intelligenzen, werden angezeigt, während der Server läuft, um die Fehlersuche zu erleichtern.
- Unterstützung für weitere FrameworksLangGraph und Pydantic AI werden derzeit unterstützt, ebenso wie AutoGen und CrewAI Die Integration wird bald verfügbar sein, und Benutzer können Anfragen über GitHub einreichen.
- Benutzerdefinierte Erweiterungen: Referenz
examples
Mustercode im Katalog zur schnellen Personalisierung.
caveat
- Sorgen Sie für eine stabile Netzverbindung, da WebSocket empfindlich auf Latenzzeiten reagiert.
- Testen Sie vor der Verwendung der Sprachfunktion, ob das Mikrofon und der Lautsprecher ordnungsgemäß funktionieren.
- Für Erstbenutzer wird empfohlen, den Befehl
examples
Katalogbeispiele, um sich mit den Grundfunktionen vertraut zu machen.