Nos últimos anos, com o rápido desenvolvimento de modelos de linguagem grandes (LLMs), os recursos dos sistemas multiagentes (MAS) foram significativamente aprimorados. Esses sistemas não só são capazes de automatizar tarefas, mas também demonstram recursos de raciocínio quase humanos. No entanto, os tradicionais MAS As arquiteturas geralmente vêm com implementações de código complexas, o que limita muito sua reutilização. Para resolver esse problema, foi desenvolvido o Nexus.Nexus é uma estrutura Python leve projetada para a criação de MAS escalonável e reutilizável baseado em LLM. Ele oferece suporte a uma arquitetura em camadas, design de fluxo de trabalho supervisionado e é fácil de usar, mesmo sem uma sólida formação técnica.
Visão geral dos sistemas multiagentes (MAS)
Os sistemas multiagentes (MAS) são os sistemas fundamentais para a inteligência artificial (IA) distribuída. Eles permitem que tarefas complexas sejam divididas em componentes mais gerenciáveis, que são então executados por inteligências autônomas (agentes). Essas inteligências usam conhecimento histórico, interações com outras inteligências e informações ambientais para tomar decisões sem intervenção humana. Essa autonomia distingue o MAS dos sistemas tradicionais de solução de problemas distribuídos e aumenta sua capacidade de operar com eficiência em ambientes dinâmicos e incertos.
No MAS, as inteligências têm um grau de autonomia e colaboram entre si para formar um todo unificado para resolver problemas. Os principais componentes da arquitetura do MAS incluem inteligências, ambientes e interações. As inteligências são atores principais com funções, recursos e modelos de conhecimento. O ambiente é o mundo externo em que as inteligências vivem, e elas percebem e agem de acordo com as informações do ambiente. A comunicação entre as inteligências é chamada de interação e pode ser na forma de coordenação, negociação ou qualquer outra forma baseada nos requisitos do sistema.
As arquiteturas de MAS podem assumir várias formas, incluindo a tradicional, a ReAct e a baseada em LLM. As arquiteturas tradicionais de MAS consistem em inteligências que interagem com o ambiente por meio de observação e ação, enquanto as arquiteturas de inteligências do tipo ReAct (Reasoning and Acting) introduzem recursos avançados de raciocínio. Já as arquiteturas baseadas em LLM utilizam LLMs como inteligências para raciocínio e tomada de decisões.
Arquitetura MAS
Os principais desafios enfrentados pelas arquiteturas de MAS incluem a coordenação entre várias inteligências, a alocação de tarefas e o dimensionamento de grandes sistemas. Para enfrentar esses desafios, os pesquisadores propuseram várias abordagens, como a hierarquia Líder-Seguidor (LF), em que a Inteligência Líder define metas globais e delega tarefas, e a estrutura de Inteligência de Nível Intermediário simplifica a descoberta de serviços e a coordenação entre as Inteligências.
Avanços recentes no campo da Modelagem de Linguagem Grande (LLM) estão aprimorando a arquitetura do MAS e seus recursos de aplicativos, como o raciocínio quase humano. Quando integrados à arquitetura do MAS, os LLMs podem atuar como inteligências centrais de raciocínio, aprimorando a adaptabilidade, a colaboração e a tomada de decisões em ambientes dinâmicos. Esses avanços também facilitaram a aplicação da EAM em áreas como raciocínio multimodal, resolução de problemas matemáticos complexos e navegação autônoma, que antes estavam fora do alcance das abordagens da EAM.
O MAS baseado em LLM se baseia em dois princípios importantes: primeiro, uma arquitetura específica da tarefa para maximizar a eficiência do LLM e, segundo, uma metodologia para implementar o conhecimento específico do domínio e sua aplicação em inteligências. Entretanto, a integração de conhecimento externo para a MAS baseada em LLM pode aumentar a complexidade geral e levar a problemas de dimensionamento devido a restrições de conhecimento e adaptabilidade limitada a diferentes domínios. Além disso, desenvolver e implantar um MAS baseado em LLM a partir do zero é muito difícil, especialmente para pessoas não técnicas.
O Nexus, uma nova estrutura Python de código aberto, permite que os usuários projetem facilmente arquiteturas MAS usando padrões de projeto com pouco código. O Nexus é leve, extensível e independente de LLM e domínio de aplicativos, permitindo a automação inteligente em uma variedade de tarefas e problemas.
Entendimento mais profundo da estrutura do Nexus
A estrutura do Nexus é baseada em um projeto modular que integra um único agente supervisor raiz com vários supervisores de tarefas e agentes de trabalho. Esses componentes são projetados de acordo com um gráfico de execução hierárquico para delegação eficiente de tarefas, dimensionamento e flexibilidade. O Root Supervisor é responsável por coordenar a comunicação entre usuários e inteligências, e suas principais responsabilidades incluem a decomposição de tarefas, a seleção de inteligência e a agregação de resultados.
A decomposição de tarefas envolve a divisão de dicas de alto nível em subtarefas acionáveis. A seleção do corpo inteligente refere-se à delegação de tarefas às inteligências de trabalho mais adequadas com base em sua especialização. Por outro lado, a agregação de resultados envolve a coleta de resultados das subtarefas delegadas e a combinação deles em uma resposta final. As inteligências de trabalho são solucionadores de problemas especializados aos quais as tarefas são atribuídas pelo supervisor. Cada corpo de inteligência de trabalho opera em um ambiente isolado que consiste em uma especialização exclusiva definida por suas mensagens de sistema, ferramentas e funções associadas e dados ambientais. Os recursos das inteligências de trabalho incluem o uso de ferramentas especializadas (por exemplo, pesquisas na Web) ou bases de conhecimento para executar tarefas específicas do domínio, refinando iterativamente os resultados da transição por meio da interação com as ferramentas ou bases de conhecimento e retornando os resultados ao supervisor após a conclusão da tarefa atribuída.
O Nexus contém uma memória global e um conjunto de ferramentas externas. A memória armazena resultados parciais com instruções e garante que todas as inteligências estejam cientes do progresso da tarefa. A memória no Nexus é um repositório compartilhado ao qual o supervisor tem acesso global, as inteligências de trabalho estão limitadas ao seu histórico de eventos e o supervisor da tarefa tem acesso a todos os locais de memória associados às inteligências atribuídas. Por outro lado, as ferramentas externas permitem que as inteligências executem tarefas específicas de forma dedicada, como pesquisas na Web ou acesso a recursos externos (baldes de armazenamento em nuvem etc.).
Arquitetura Nexus
O Nexus apresenta um processo iterativo para decomposição e execução de tarefas, dividido em três loops de interação principais:
- interação usuário-supervisorNesse loop, o usuário fornece um prompt de alto nível para o supervisor. O supervisor explica e delineia o plano de execução da tarefa e continua a alinhar o plano com as metas do usuário. Essa troca é iterativa e continua até que o supervisor esteja pronto para delegar subtarefas a outras inteligências ou finalizar uma solução.
- Supervisor - Coordenação Corporal InteligenteNesse ciclo, os supervisores atribuem subtarefas às inteligências de trabalho de acordo com seu grau de especialização. Em seguida, as inteligências de trabalho usam as ferramentas disponíveis e geram resultados intermediários.
- Operação interna do corpo inteligenteO último loop funciona no ambiente interno de cada inteligência de trabalho. As inteligências de trabalho aprimoram os resultados intermediários com base no uso iterativo de ferramentas e recursos externos. Quando uma solução é obtida, ela é encaminhada de volta ao supervisor para a síntese final.
Esses loops permitem que o Nexus ofereça suporte a uma variedade de padrões de interação entre as inteligências e seus ambientes operacionais. Ele é dimensionável, modular e robusto, em que a estrutura pode incorporar novas inteligências à medida que a complexidade da tarefa aumenta, as inteligências de trabalho podem operar de forma independente e a delegação hierárquica com loops de feedback iterativos reduz o impacto das falhas das inteligências porque as tarefas podem ser facilmente reatribuídas ou aprimoradas.
Avaliação e análise do desempenho do Nexus
A avaliação de desempenho do Nexus baseia-se na taxa de aprovação, ou seja, a proporção do número de amostras que passam em todas as verificações em relação ao número total de amostras no teste de referência. Nas tarefas de codificação, a eficácia da estrutura do Nexus foi avaliada com base em sua eficiência na solução de tarefas relacionadas à programação. A avaliação usa os benchmarks HumanEval e VerilogEval-Human.
O benchmark HumanEval baseia-se em uma coleção de 164 problemas focados na geração de código Python, enquanto o VerilogEval-Human contém 156 desafios que envolvem a geração e verificação de código Verilog. A figura abaixo ilustra a arquitetura MAS baseada em Nexus para resolver tarefas relacionadas a códigos.
Arquitetura MAS baseada em Nexus para tarefas relacionadas a códigos
A tabela abaixo mostra a eficácia do fluxo de trabalho proposto com base nas taxas de aprovação dos estudos de ablação.
Resultados - 1
A tabela a seguir compara o desempenho do fluxo de trabalho baseado no Nexus proposto com as soluções existentes relacionadas.
Resultados - 2
A eficácia do Nexus na solução de problemas matemáticos foi demonstrada com o conjunto de dados MATH. Foi usado o seguinte fluxo de trabalho, no qual foram usadas as inteligências do supervisor, do matemático e do revisor. Todas elas são apoiadas pelo Claude O LLM 3.5v2 oferece suporte.
Arquitetura de MAS baseada em Nexus para problemas matemáticos
Resultados dos estudos de ablação no conjunto de dados MATH
Prática do Nexus: revisão e refatoração de código
Em seguida, demonstramos como criar uma arquitetura MAS com o Nexus para revisão e refatoração de código, usando um exemplo real.
Etapa 1: Instale as bibliotecas necessárias
!git clone https://github.com/PrimisAI/nexus.git
nexus
!pip install -e .
Etapa 2: Importar a biblioteca e definir a configuração do LLM
from primisai.nexus.core import Agent, Supervisor
from google.colab import userdata
importar os
os.environ["OPENAI_API_KEY"] = userdata.get("OPENAI_API_KEY")
llm_config = {
"api_key": os.getenv("OPENAI_API_KEY"),
"model": "gpt-4o",
"base_url": "https://api.openai.com/v1"
}
Etapa 3: Crie três inteligências: Supervisor, CodeReviewer e CodeRefactor.
# Criação de uma inteligência de supervisor
coordinator = Supervisor("ProgrammingCoordinator", llm_config)
# Criar a inteligência do revisor de código e definir suas mensagens de sistema
code_reviewer = Agent(
"CodeReviewer",
llm_config.
system_message="Você é um especialista em codificação que se concentra na análise de código. Sua tarefa é revisar o código, identificar erros e sugerir melhorias."
)
# Crie a inteligência de refatoração de código e defina sua mensagem de sistema
code_refactor = Agent(
"CodeRefactor",
llm_config.
system_message="Você é um especialista em codificação focado em refatoração de código. Seu objetivo é melhorar a legibilidade e a eficiência do seu código."
)
Etapa 4: Registro da inteligência com o coordenador
coordinator.register_agent(code_reviewer)
coordenador.register_agent(code_refactor)
Etapa 5: Exibir a hierarquia da Intelligentsia
coordinator.display_agent_graph()
Etapa 6: Inicie uma sessão interativa e forneça um exemplo de código Python para revisão e refatoração.
coordinator.start_interactive_session()
exportações
Como você pode ver no resultado, a Nexus conseguiu revisar e refatorar nosso código Python fornecido com base na arquitetura MAS e apresentou uma versão mais robusta, eficiente e fácil de usar que incluía a documentação adequada.
Resumo e perspectivas
O Nexus, uma estrutura Python leve, simplifica muito o desenvolvimento e o gerenciamento de sistemas de inteligência múltipla baseados em LLM. O Nexus representa um avanço significativo no desenvolvimento de MAS e promete aprimorar ainda mais os recursos de solução de problemas baseados em LLM.
No futuro, à medida que a tecnologia LLM continuar a evoluir, espera-se que o Nexus desempenhe um papel mais importante nas seguintes áreas:
- Processamento de tarefas mais complexasCom recursos aprimorados de raciocínio LLM, o Nexus pode lidar com tarefas mais complexas e desafiadoras, como integração de conhecimento entre domínios, planejamento de longo prazo e assim por diante.
- Maior variedade de cenários de aplicaçãoA flexibilidade e a escalabilidade do Nexus permitem que ele seja usado em uma ampla gama de aplicativos, como manufatura inteligente, cidades inteligentes, fintech e muito mais.
- Maior apoio da comunidadeComo o Nexus tem código aberto e é promovido, mais desenvolvedores se envolverão no desenvolvimento e no refinamento do Nexus e, juntos, eles ampliarão os limites da tecnologia MAS.
Em suma, o Nexus fornece uma plataforma avançada e flexível para a criação e o gerenciamento de sistemas corporais multiinteligentes, e seu surgimento acelerará o desenvolvimento do campo de IA e fornecerá novas ideias e métodos para resolver problemas complexos no mundo real.
Referência:https://arxiv.org/pdf/2502.19091