Mahilo: una plataforma integrada para conectar diferentes marcos de inteligencia artificial y colaborar en tiempo real
Últimos recursos sobre IAPublicado hace 5 meses Círculo de intercambio de inteligencia artificial 2.1K 00
Introducción general
Mahilo es una plataforma de integración multiinteligencia de código abierto, publicada en GitHub por el desarrollador Jayesh Sharma, diseñada para ayudar a los usuarios a conectar inteligencias de IA de diferentes marcos para apoyar la comunicación en tiempo real, la interacción persona-ordenador y la colaboración inteligente. La plataforma ofrece una interfaz común para integrar inteligencias de marcos como LangGraph, Pydantic AI, o añadir inteligencias a través de API personalizadas. Admite interacciones de voz y texto y permite que varios usuarios colaboren con inteligencias en un espacio compartido. Con más de 50 estrellas en GitHub y más de 500 descargas de PyPI al mes a partir de marzo de 2025, Mahilo es adecuado para diversos escenarios, como la creación de contenidos, la respuesta de emergencia, el emparejamiento de bienes inmuebles, etc. Mahilo simplifica el desarrollo de sistemas corporales multiinteligentes con herramientas y módulos flexibles que facilitan la creación de soluciones para tareas automatizadas complejas.

Lista de funciones
- Integración de la Inteligencia GeneralSoporte para conectarse a inteligencias de marcos como LangGraph, Pydantic AI, o inteligencias personalizadas a través de la interfaz BaseAgent.
- comunicación en tiempo real: Proporciona una conexión WebSocket para la interacción instantánea de voz y texto entre inteligencias.
- Colaboración inteligenteLos inteligentes pueden compartir de forma autónoma el contexto y la información a través de AgentManager para mejorar la eficacia de las tareas.
- soporte multiusuarioPermite a varios usuarios colaborar con inteligencias en tiempo real en un espacio inteligente compartido.
- función de voz: El soporte para entrada y salida de voz requiere una instalación adicional de PyAudio.
- Estrategia a nivel organizativoAplicación uniforme de las políticas de comportamiento y seguridad en todas las inteligencias para garantizar la coherencia.
- Arquitectura flexible: Apoyan la construcción de complejos sistemas corporales multiinteligentes y se adaptan a múltiples modos de comunicación.
Utilizar la ayuda
Proceso de instalación
Para utilizar Mahilo localmente, debe completar los siguientes pasos de instalación:
- Requisitos medioambientales
- Instale Python 3.8 o posterior.
- Instala Git para clonar repositorios de GitHub.
- Si necesitas funcionalidad de voz, prepara PyAudio (ver instalación más abajo).
- almacén de clones
Ejecute el siguiente comando en un terminal para obtener el código Mahilo:
git clone https://github.com/wjayesh/mahilo.git
cd mahilo
- Instalación de dependencias
Vaya al directorio del proyecto e instale las dependencias del núcleo:
pip install -r requirements.txt
Si necesita soporte de voz, ejecútelo:
pip install "mahilo[voice]"
- Instalar PyAudio (dependencias habilitadas para voz)
- Windows (ordenador): Ejecutar
pip install pyaudio
Si esto falla, puede descargar la versión correspondiente de.whl
Instalación de archivos. - MacOSInstale primero Homebrew (
brew install portaudio
), ejecutepip install pyaudio
. - LinuxInstalar dependencias del sistema (
sudo apt-get install portaudio19-dev
), ejecutepip install pyaudio
.
- Iniciar el servidor
Una vez finalizada la instalación, ejecute el siguiente comando para iniciar el servidor WebSocket:
python -m mahilo.server
Por defecto se ejecuta en el http://localhost:8000
La dirección y el puerto pueden modificarse a través del archivo de configuración.
Cómo utilizarlo
El uso de Mahilo se divide en tres pasos principales: definición de inteligencias, funcionamiento del servidor e interacción con el cliente. A continuación se presenta una guía detallada de funcionamiento:
1. Definir y gestionar las inteligencias
- Crear inteligencia básica: Uso
BaseAgent
Defina una inteligencia simple, como una inteligencia de ventas:
from mahilo.agent import BaseAgent
from mahilo.agent_manager import AgentManager
sales_agent = BaseAgent(
type="sales_agent",
description="负责处理销售任务的智能体",
tools=["crm_tool"]
)
manager = AgentManager()
manager.register_agent(sales_agent)
- Integración de inteligencias marco externas: por LangGraph A modo de ejemplo:
from mahilo.integrations.langgraph.agent import LangGraphAgent marketing_agent = LangGraphAgent( langgraph_agent=graph_builder, name="MarketingAgent", description="营销策略智能体", can_contact=["sales_agent"] ) manager.register_agent(marketing_agent)
2. Inicie el servidor WebSocket
- Inicializar y ejecutar el servidor en un script:
from mahilo.server import ServerManager server = ServerManager(manager) server.run()
- Una vez iniciado el servidor, smart puede aceptar conexiones de clientes a través de WebSocket.
3. Conexión e interacción con el cliente
- interacción de textoEjecuta el siguiente comando para conectar las inteligencias:
python client.py --agent-name sales_agent
Tras una conexión satisfactoria, puedes introducir texto para dialogar con el cuerpo inteligente, por ejemplo: "¿Cómo puedo aumentar mis ventas?".
- interacción por voz: Añadir
--voice
para activar la función de voz:python client.py --agent-name sales_agent --voice
El sistema escucha la entrada del micrófono y devuelve una respuesta de voz a través del altavoz.
4. Colaboración multiinteligencia
- compartir contexto: Las inteligencias múltiples pasan
AgentManager
Gestionar el contexto del diálogo. Por ejemplo, una Inteligencia de Ventas puede preguntar a una Inteligencia de Marketing:[sales_agent] 如何提高销量? [marketing_agent] 建议增加社交媒体广告投放。
- colaboración multiusuario: Varios clientes pueden conectarse al mismo tiempo, por ejemplo:
python client.py --agent-name buyer_agent python client.py --agent-name seller_agent
Los usuarios y las inteligencias pueden interactuar en tiempo real en un espacio compartido para simular escenarios de colaboración multipersonal.
5. Ejemplos de aplicaciones prácticas
- Tejedor de historias: Ejecute aplicaciones de creación colaborativa de contenidos:
story_agent = BaseAgent(type="story_agent", description="故事创作助手") manager.register_agent(story_agent) server.run()
Una vez conectado, entra en "Iniciar una historia de aventuras" y la inteligencia generará contenidos y colaborará con otros usuarios.
- Coordinación de la respuesta de emergencia: Crear inteligencias múltiples para procesar la información y asignar tareas, por ejemplo:
emergency_agent = BaseAgent(type="emergency_agent", description="紧急响应协调")
- Matching inmobiliario: Los organismos inteligentes pueden cotejar propiedades y ofrecer sugerencias en función de las necesidades del usuario.
6. Depuración y ampliaciones
- Vista de registro: Los registros de comunicación, como las preguntas y respuestas entre inteligencias, se muestran mientras el servidor está en funcionamiento para facilitar la depuración.
- Compatibilidad con más marcosActualmente son compatibles LangGraph y Pydantic AI, así como AutoGen y CrewAI La integración estará disponible en breve y los usuarios podrán enviar solicitudes a través de GitHub.
- Extensiones personalizadas: Referencia
examples
Código de muestra en el catálogo para una rápida personalización.
advertencia
- Garantice una conexión de red estable, WebSocket es sensible a la latencia.
- Antes de utilizar la función de voz, compruebe que el micrófono y el altavoz funcionan correctamente.
- Para los primeros usuarios se recomienda ejecutar
examples
catálogo de ejemplos para familiarizarse con las funciones básicas.
© declaración de copyright
文章版权归 Círculo de intercambio de inteligencia artificial 所有,未经允许请勿转载。
Artículos relacionados
Sin comentarios...