Allgemeine Einführung
Mahilo ist eine quelloffene Multi-Intelligenz-Integrationsplattform, die der Entwickler Jayesh Sharma auf GitHub veröffentlicht hat. Sie soll Nutzern helfen, KI-Intelligenzen aus verschiedenen Frameworks zu verbinden, um Echtzeitkommunikation, Mensch-Computer-Interaktion und intelligente Zusammenarbeit zu unterstützen. Die Plattform bietet eine einheitliche Schnittstelle zur Integration von Intelligenzen aus Frameworks wie LangGraph und Pydantic AI oder zum Hinzufügen von Intelligenzen über benutzerdefinierte APIs. Sie unterstützt Sprach- und Textinteraktionen und ermöglicht mehreren Benutzern die Zusammenarbeit mit Intelligenzen in einem gemeinsamen Raum. Mit mehr als 50 Sternen auf GitHub und mehr als 500 PyPI-Downloads pro Monat (Stand: März 2025) eignet sich Mahilo für verschiedene Szenarien wie die Erstellung von Inhalten, die Reaktion auf Notfälle, den Abgleich von Immobilien usw. Mahilo vereinfacht die Entwicklung von multi-intelligenten Körpersystemen mit flexiblen Werkzeugen und Modulen, die es leicht machen, Lösungen für komplexe automatisierte Aufgaben zu erstellen.
Funktionsliste
- Integration der allgemeinen IntelligenzUnterstützung für die Verbindung mit Intelligenzen aus Frameworks wie LangGraph, Pydantic AI oder benutzerdefinierten Intelligenzen über die BaseAgent-Schnittstelle.
- EchtzeitkommunikationBietet eine WebSocket-Verbindung für sofortige Sprach- und Textinteraktion zwischen Intelligenzen.
- Intelligente ZusammenarbeitIntelligente Systeme können über den AgentManager selbstständig Kontext und Informationen austauschen, um die Effizienz ihrer Aufgaben zu verbessern.
- Multi-User-UnterstützungErmöglicht mehreren Benutzern die Zusammenarbeit mit Intelligenzen in Echtzeit in einem gemeinsamen intelligenten Raum.
- SprachfunktionUnterstützung für Spracheingabe und -ausgabe erfordert eine zusätzliche Installation von PyAudio.
- Strategie auf organisatorischer EbeneVerhaltens- und Sicherheitsrichtlinien einheitlich für alle Intelligenzen durchsetzen, um Konsistenz zu gewährleisten.
- Flexible ArchitekturUnterstützung des Aufbaus komplexer multi-intelligenter Körpersysteme und Anpassung an mehrere Kommunikationsmodi.
Hilfe verwenden
Ablauf der Installation
Um Mahilo lokal zu nutzen, müssen Sie die folgenden Installationsschritte durchführen:
- Anforderungen an die Umwelt
- Installieren Sie Python 3.8 oder höher.
- Installieren Sie Git zum Klonen von GitHub-Repositories.
- Wenn Sie Sprachfunktionen benötigen, bereiten Sie PyAudio vor (siehe unten zur Installation).
- Klon-Lager
Führen Sie den folgenden Befehl in einem Terminal aus, um den Mahilo-Code zu erhalten:
git clone https://github.com/wjayesh/mahilo.git
cd mahilo
- Installation von Abhängigkeiten
Wechseln Sie in das Projektverzeichnis und installieren Sie die Kernabhängigkeiten:
pip install -r anforderungen.txt
Wenn Sprachunterstützung erforderlich ist, führen Sie diese aus:
pip install "mahilo[voice]"
- PyAudio installieren (sprachaktivierte Abhängigkeiten)
- Windows (Computer): Lauf
pip install pyaudio
Wenn dies nicht gelingt, können Sie die entsprechende Version von.whl
Datei-Installation. - MacOS: Installieren Sie zuerst Homebrew (
brew install portaudio
), dann führen Siepip install pyaudio
. - LinuxSystemabhängigkeiten installieren (
sudo apt-get install portaudio19-dev
), dann führen Siepip install pyaudio
.
- Starten Sie den Server
Nachdem die Installation abgeschlossen ist, führen Sie den folgenden Befehl aus, um den WebSocket-Server zu starten:
python -m mahilo.server
Die Standardeinstellung ist die Ausführung im http://localhost:8000
Die Adresse und der Port können über die Konfigurationsdatei geändert werden.
Wie zu verwenden
Die Nutzung von Mahilo gliedert sich in drei Hauptschritte: Definition der Intelligenz, Serverbetrieb und Client-Interaktion. Im Folgenden finden Sie eine detaillierte Anleitung zur Bedienung:
1. die Definition und Verwaltung von Intelligenzen
- Grundlegende Intelligenz schaffen: Verwendung
BaseAgent
Definieren Sie eine einfache Intelligenz, z. B. eine Vertriebsintelligenz:
from mahilo.agent import BaseAgent
from mahilo.agent_manager importieren AgentManager
sales_agent = BaseAgent(
type="sales_agent",
description="Intelligenter Agent, der für die Abwicklung von Vertriebsaufgaben zuständig ist",
tools=["crm_tool"]
)
manager = AgentManager()
manager.register_agent(vertriebs_agent)
- Integration von externen Rahmenintelligenzen: von LangGraph Ein Beispiel:
from mahilo.integrations.langgraph.agent import LangGraphAgent marketing_agent = LangGraphAgent( langgraph_agent=graph_builder, name="MarketingAgent", description="Intelligente Marketingstrategie", can_contact=["sales_agent"] ) manager.register_agent(marketing_agent)
2. starten Sie den WebSocket-Server
- Initialisieren und starten Sie den Server in einem Skript:
from mahilo.server.import ServerManager server = ServerManager(manager) server.run()
- Sobald der Server gestartet ist, kann der smart Client-Verbindungen über WebSocket annehmen.
3. die Verbindung und Interaktion mit dem Kunden
- Textinteraktion: Führen Sie den folgenden Befehl aus, um die Intelligenzen zu verbinden:
python client.py --agent-name sales_agent
Nach erfolgreicher Verbindung können Sie einen Text eingeben, um einen Dialog mit dem Smart Body zu führen, zum Beispiel: "Wie kann ich meinen Umsatz steigern?"
- Sprach-Interaktion: Hinzufügen
--Stimme
um die Sprachfunktion zu aktivieren:python client.py --agent-name sales_agent --voice
Das System hört auf die Mikrofoneingabe und gibt eine Sprachantwort über den Lautsprecher.
4. die Zusammenarbeit zwischen mehreren Geheimdiensten
- KontextfreigabeMultiple Intelligenz: Pass
AgentManager
Verwaltung des Dialogkontexts. Zum Beispiel kann eine Sales Intelligence eine Marketing Intelligence fragen:[sales_agent] Wie kann man den Umsatz steigern? [marketing_agent] Ich schlage vor, die Werbung in den sozialen Medien zu verstärken.
- Multi-User-ZusammenarbeitMehrere Clients können gleichzeitig eine Verbindung herstellen, zum Beispiel:
python client.py --agent-name käufer_agent python client.py --agent-name seller_agent
Benutzer und Intelligenzen können in Echtzeit in einem gemeinsamen Raum interagieren, um Szenarien der Zusammenarbeit mehrerer Personen zu simulieren.
5 Beispiele für praktische Anwendungen
- Geschichtenweber: Führen Sie Anwendungen zur kollaborativen Erstellung von Inhalten aus:
story_agent = BaseAgent(type="story_agent", description="Story Creation Assistant") manager.register_agent(story_agent) server.run()
Sobald die Verbindung hergestellt ist, geben Sie "Starte eine Abenteuergeschichte" ein und die Intelligenz wird Inhalte erstellen und mit anderen Nutzern zusammenarbeiten.
- Koordinierung der NotfallmaßnahmenMultiple Intelligenzen schaffen, um z. B. Informationen zu verarbeiten und Aufgaben zu verteilen:
emergency_agent = BaseAgent(type="emergency_agent", description="Emergency Response Coordination")
- Immobilien-MatchingIntelligente Stellen können Eigenschaften abgleichen und Vorschläge auf der Grundlage der Bedürfnisse der Nutzer machen.
6. debugging und Erweiterungen
- Log-AnsichtKommunikationsprotokolle, wie z.B. Fragen und Antworten zwischen Intelligenzen, werden angezeigt, während der Server läuft, um die Fehlersuche zu erleichtern.
- Unterstützung für weitere FrameworksLangGraph und Pydantic AI werden derzeit unterstützt, ebenso wie AutoGen und CrewAI Die Integration wird bald verfügbar sein, und Benutzer können Anfragen über GitHub einreichen.
- Benutzerdefinierte Erweiterungen: Referenz
Beispiele
Mustercode im Katalog zur schnellen Personalisierung.
caveat
- Sorgen Sie für eine stabile Netzverbindung, da WebSocket empfindlich auf Latenzzeiten reagiert.
- Testen Sie vor der Verwendung der Sprachfunktion, ob das Mikrofon und der Lautsprecher ordnungsgemäß funktionieren.
- Für Erstbenutzer wird empfohlen, den Befehl
Beispiele
Katalogbeispiele, um sich mit den grundlegenden Funktionen vertraut zu machen.