Mahilo: интегрированная платформа для объединения различных систем искусственного интеллекта для совместной работы в режиме реального времени
Общее введение
Mahilo - это платформа интеграции мультиинтеллектов с открытым исходным кодом, опубликованная на GitHub разработчиком Джайешем Шармой (Jayesh Sharma), призванная помочь пользователям объединить ИИ-интеллекты из различных фреймворков для поддержки общения в реальном времени, взаимодействия человека и компьютера и интеллектуального сотрудничества. Платформа предоставляет общий интерфейс для интеграции интеллектов из таких фреймворков, как LangGraph, Pydantic AI, или добавления интеллектов через пользовательские API. Она поддерживает голосовое и текстовое взаимодействие и позволяет нескольким пользователям сотрудничать с интеллектами в общем пространстве. Имея 50+ звезд на GitHub и более 500 загрузок PyPI в месяц по состоянию на март 2025 года, Mahilo подходит для различных сценариев, таких как создание контента, реагирование на чрезвычайные ситуации, подбор недвижимости и т. д. Mahilo упрощает разработку мультиинтеллектуальных систем с помощью гибких инструментов и модулей, которые позволяют легко создавать решения для сложных автоматизированных задач.

Список функций
- Интеграция общей разведки: Поддержка подключения к интеллектам из таких фреймворков, как LangGraph, Pydantic AI, или пользовательских интеллектов через интерфейс BaseAgent.
- связь в реальном времени: Обеспечивает соединение WebSocket для мгновенного голосового и текстового взаимодействия между интеллектами.
- Интеллектуальное сотрудничествоИнтеллекты могут автономно обмениваться контекстом и информацией через AgentManager, чтобы повысить эффективность выполнения задач.
- многопользовательская поддержка: Позволяет нескольким пользователям сотрудничать с интеллектами в режиме реального времени в общем интеллектуальном пространстве.
- голосовая функция: Поддержка голосового ввода и вывода требует дополнительной установки PyAudio.
- Стратегия на уровне организацииОбеспечьте единообразное применение политик поведения и безопасности для всех интеллектов, чтобы обеспечить согласованность.
- Гибкая архитектура: Поддерживают создание сложных мультиинтеллектуальных систем организма и адаптируются к многочисленным способам коммуникации.
Использование помощи
Процесс установки
Чтобы использовать Mahilo локально, необходимо выполнить следующие шаги по установке:
- Экологические требования
- Установите Python 3.8 или более позднюю версию.
- Установите Git для клонирования репозиториев GitHub.
- Если вам нужна голосовая функциональность, подготовьте PyAudio (об установке см. ниже).
- склад клонов
Выполните следующую команду в терминале, чтобы получить код Mahilo:
git clone https://github.com/wjayesh/mahilo.git
cd mahilo
- Установка зависимостей
Перейдите в каталог проекта и установите основные зависимости:
pip install -r requirements.txt
Если требуется голосовая поддержка, запустите ее:
pip install "mahilo[voice]"
- Установите PyAudio (зависимости для работы с голосом).
- Windows (компьютер): Беги
pip install pyaudio
Если это не удается, вы можете загрузить соответствующую версию.whl
Установка файлов. - MacOS: Сначала установите Homebrew (
brew install portaudio
), затем выполнитеpip install pyaudio
. - Linux: Установите системные зависимости (
sudo apt-get install portaudio19-dev
), затем выполнитеpip install pyaudio
.
- Запустите сервер
После завершения установки выполните следующую команду, чтобы запустить сервер WebSocket:
python -m mahilo.server
По умолчанию запускается в http://localhost:8000
Адрес и порт можно изменить через конфигурационный файл.
Как использовать
Использование Mahilo делится на три основных этапа: определение интеллекта, работа с сервером и взаимодействие с клиентом. Ниже представлено подробное руководство по работе:
1. Определение и управление интеллектом
- Создание базового интеллекта: Использование
BaseAgent
Определите простой интеллект, например, интеллект продаж:
from mahilo.agent import BaseAgent
from mahilo.agent_manager import AgentManager
sales_agent = BaseAgent(
type="sales_agent",
description="负责处理销售任务的智能体",
tools=["crm_tool"]
)
manager = AgentManager()
manager.register_agent(sales_agent)
- Интеграция внешних фреймовых интеллектов: по LangGraph В качестве примера:
from mahilo.integrations.langgraph.agent import LangGraphAgent marketing_agent = LangGraphAgent( langgraph_agent=graph_builder, name="MarketingAgent", description="营销策略智能体", can_contact=["sales_agent"] ) manager.register_agent(marketing_agent)
2. Запустите сервер WebSocket
- Инициализируйте и запустите сервер в сценарии:
from mahilo.server import ServerManager server = ServerManager(manager) server.run()
- После запуска сервера смарт может принимать клиентские соединения через WebSocket.
3. подключение и взаимодействие с клиентами
- текстовое взаимодействие: Выполните следующую команду, чтобы соединить интеллекты:
python client.py --agent-name sales_agent
После успешного соединения вы можете ввести текст для диалога с умным телом, например, "Как я могу увеличить свои продажи?".
- голосовое взаимодействие: Добавить
--voice
параметр, чтобы включить голосовую функцию:python client.py --agent-name sales_agent --voice
Система прослушивает микрофонный сигнал и выдает голосовой ответ через динамик.
4. Сотрудничество нескольких разведок
- совместное использование контекстаМножественные интеллекты проходят
AgentManager
Управление контекстом диалога. Например, специалист по продажам может спросить у специалиста по маркетингу:[sales_agent] 如何提高销量? [marketing_agent] 建议增加社交媒体广告投放。
- многопользовательская совместная работа: Несколько клиентов могут подключаться одновременно, например:
python client.py --agent-name buyer_agent python client.py --agent-name seller_agent
Пользователи и интеллекты могут взаимодействовать в реальном времени в общем пространстве для моделирования сценариев совместной работы нескольких человек.
5. Примеры практического применения
- Ткач историй: Запуск приложений для совместного создания контента:
story_agent = BaseAgent(type="story_agent", description="故事创作助手") manager.register_agent(story_agent) server.run()
После подключения введите "Начать историю приключений", и интеллект начнет генерировать контент и сотрудничать с другими пользователями.
- Координация действий в чрезвычайных ситуациях: Создайте несколько интеллектов, чтобы обрабатывать информацию и распределять задачи, например:
emergency_agent = BaseAgent(type="emergency_agent", description="紧急响应协调")
- Подбор недвижимости: Интеллектуальные органы могут подбирать свойства и предоставлять предложения в зависимости от потребностей пользователя.
6. Отладка и расширения
- Просмотр журнала: Журналы общения, такие как вопросы и ответы между интеллектами, отображаются во время работы сервера, чтобы облегчить отладку.
- Поддержка большего количества фреймворковВ настоящее время поддерживаются LangGraph и Pydantic AI, а также AutoGen и CrewAI Интеграция будет доступна в ближайшее время, а пользователи могут отправлять запросы через GitHub.
- Пользовательские расширения: Справочник
examples
Образец кода в каталоге для быстрой персонализации.
предостережение
- Обеспечьте стабильное сетевое соединение, WebSocket чувствителен к задержкам.
- Перед использованием голосовой функции проверьте работоспособность микрофона и динамика.
- Для начинающих пользователей рекомендуется запустить
examples
примеры из каталога, чтобы ознакомиться с основными функциями.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...