Nexus : une nouvelle génération de frameworks Python pour construire des systèmes corporels multi-intelligents et évolutifs

Base de connaissances sur l'IAMise à jour il y a 6 mois Cercle de partage de l'IA

7.1K 00

Ces dernières années, avec le développement rapide des grands modèles de langage (LLM), les capacités des systèmes multi-agents (MAS) ont été considérablement améliorées. Ces systèmes sont non seulement capables d'automatiser des tâches, mais aussi de faire preuve de capacités de raisonnement proches de celles de l'homme. Cependant, les systèmes traditionnels de MAS Les architectures sont souvent accompagnées d'un code d'implémentation complexe, ce qui limite considérablement leur réutilisation. Nexus a été développé pour résoudre ce problème.Nexus est un cadre Python léger conçu pour construire des MAS évolutifs et réutilisables basés sur LLM. Il prend en charge une architecture en couches, une conception supervisée du flux de travail et est facile à utiliser, même sans connaissances techniques approfondies.

Aperçu des systèmes multi-agents (SMA)

Les systèmes multi-agents (SMA) sont les systèmes fondamentaux de l'intelligence artificielle (IA) distribuée. Ils permettent de décomposer des tâches complexes en éléments plus faciles à gérer, qui sont ensuite exécutés par des intelligences autonomes (agents). Ces intelligences utilisent des connaissances historiques, des interactions avec d'autres intelligences et des informations environnementales pour prendre des décisions sans intervention humaine. Cette autonomie distingue les SMA des systèmes distribués traditionnels de résolution de problèmes et renforce leur capacité à fonctionner efficacement dans des environnements dynamiques et incertains.

Dans la MAS, les intelligences disposent d'un certain degré d'autonomie et collaborent les unes avec les autres pour former un ensemble unifié afin de résoudre les problèmes. Les intelligences sont les acteurs principaux qui ont des rôles, des capacités et des modèles de connaissances. L'environnement est le monde extérieur dans lequel vivent les intelligences, qui perçoivent les informations présentes dans l'environnement et agissent en conséquence. La communication entre les intelligences est appelée interaction et peut prendre la forme d'une coordination, d'une négociation ou toute autre forme basée sur les exigences du système.

Les architectures MAS peuvent prendre différentes formes : traditionnelles, ReAct et LLM. Les architectures MAS traditionnelles consistent en des intelligences qui interagissent avec l'environnement par l'observation et l'action, tandis que les architectures d'intelligences de type ReAct (Reasoning and Acting) introduisent des capacités de raisonnement avancées. Les architectures basées sur les LLM utilisent les LLM comme intelligences pour le raisonnement et la prise de décision.

Architecture MAS

Les principaux défis auxquels sont confrontées les architectures MAS sont la coordination entre plusieurs intelligences, la répartition des tâches et l'extensibilité des grands systèmes. Pour relever ces défis, les chercheurs ont proposé diverses approches telles que la hiérarchie Leader-Follower (LF), dans laquelle l'intelligence Leader définit les objectifs globaux et délègue les tâches, et le cadre de l'intelligence de niveau intermédiaire simplifie la découverte des services et la coordination entre les intelligences.

Les progrès récents dans le domaine de la modélisation du langage étendu (LLM) améliorent l'architecture de la MAS et ses capacités d'application, telles que le raisonnement quasi-humain. Lorsqu'ils sont intégrés dans l'architecture de la MAS, les LLM peuvent agir comme des intelligences de raisonnement centrales, améliorant l'adaptabilité, la collaboration et la prise de décision dans des environnements dynamiques. Ces progrès ont également facilité l'application de la SMA dans des domaines tels que le raisonnement multimodal, la résolution de problèmes mathématiques complexes et la navigation autonome, qui étaient auparavant hors de portée des approches de la SMA.

La MAS basée sur le LLM repose sur deux principes importants : une architecture spécifique à la tâche pour maximiser l'efficacité du LLM et une méthodologie pour mettre en œuvre des connaissances spécifiques au domaine et leur application dans les intelligences. Cependant, l'intégration de connaissances externes pour la MAS basée sur le LLM peut augmenter la complexité globale et conduire à des problèmes d'évolutivité en raison de contraintes de connaissances et d'une adaptabilité limitée à différents domaines. En outre, le développement et le déploiement d'un MAS basé sur le LLM à partir de zéro est très difficile, en particulier pour les personnes non techniques.

Nexus, un nouveau framework Python open-source, permet aux utilisateurs de concevoir facilement des architectures MAS en utilisant des standards de conception low-code. Nexus est léger, extensible et agnostique en termes de LLM et de domaine d'application, permettant une automatisation intelligente à travers une variété de tâches et de problèmes.

Une compréhension plus approfondie du cadre Nexus

Le cadre Nexus est basé sur une conception modulaire qui intègre un seul agent superviseur racine avec plusieurs agents superviseurs de tâches et agents travailleurs. Ces composants sont conçus selon un graphe d'exécution hiérarchique pour une délégation efficace des tâches, l'extensibilité et la flexibilité. Le superviseur principal est chargé de coordonner la communication entre les utilisateurs et les intelligences, et ses principales responsabilités comprennent la décomposition des tâches, la sélection des intelligences et l'agrégation des résultats.

La décomposition des tâches consiste à décomposer les indices de haut niveau en sous-tâches exploitables. La sélection de l'organe intelligent consiste à déléguer les tâches aux intelligences de travail les plus appropriées en fonction de leur spécialisation. D'autre part, l'agrégation des résultats consiste à collecter les résultats des sous-tâches déléguées et à les combiner en une réponse finale. Les intelligences de travail sont des spécialistes de la résolution de problèmes auxquels le superviseur assigne des tâches. Chaque organe d'intelligence du travail fonctionne dans un environnement isolé qui consiste en une spécialisation unique définie par ses messages système, les outils et fonctions associés et les données environnementales. Les capacités des intelligences de travail comprennent l'utilisation d'outils spécialisés (par exemple, des recherches sur le web) ou de bases de connaissances pour effectuer des tâches spécifiques à un domaine, l'affinage itératif des résultats de la transition en interagissant avec les outils ou les bases de connaissances, et le renvoi des résultats au superviseur une fois la tâche assignée achevée.

Nexus contient une mémoire globale et un ensemble d'outils externes. La mémoire du Nexus est un référentiel partagé auquel le superviseur a un accès global, les intelligences qui travaillent sont limitées à leur historique d'événements, et le superviseur de la tâche a accès à tous les emplacements de mémoire associés aux intelligences qui lui sont assignées. D'autre part, des outils externes permettent aux intelligences d'effectuer des tâches spécifiques de manière dédiée, telles que des recherches sur le web ou l'accès à des ressources externes (stockage en nuage, etc.).

Architecture Nexus

Nexus introduit un processus itératif de décomposition et d'exécution des tâches, divisé en trois boucles d'interaction principales :

l'interaction entre l'utilisateur et le superviseurDans cette boucle, l'utilisateur donne une instruction de haut niveau au superviseur. Le superviseur explique et décrit le plan d'exécution de la tâche et continue à aligner le plan sur les objectifs de l'utilisateur. Cet échange est itératif et se poursuit jusqu'à ce que le superviseur soit prêt à déléguer des sous-tâches à d'autres intelligences ou à finaliser une solution.
Superviseur - Coordination du corps intelligentDans cette boucle, les superviseurs attribuent des sous-tâches aux intelligences de travail en fonction de leur degré de spécialisation. Les intelligences de travail utilisent ensuite les outils disponibles et génèrent des résultats intermédiaires.
Fonctionnement interne de l'organisme intelligentLa dernière boucle fonctionne dans l'environnement interne de chaque intelligence de travail. Les intelligences de travail améliorent les résultats intermédiaires grâce à l'utilisation itérative d'outils et de ressources externes. Une fois la solution obtenue, elle est transmise au superviseur pour la synthèse finale.

Ces boucles permettent à Nexus de prendre en charge une variété de modèles d'interaction entre les intelligences et leurs environnements opérationnels. Il est évolutif, modulaire et robuste, le cadre pouvant intégrer de nouvelles intelligences au fur et à mesure que la complexité des tâches augmente, les intelligences de travail pouvant fonctionner de manière indépendante et la délégation hiérarchique avec des boucles de rétroaction itératives réduisant l'impact des défaillances des intelligences car les tâches peuvent être facilement réaffectées ou améliorées.

Évaluation et analyse des performances de Nexus

L'évaluation des performances de Nexus est basée sur le taux de réussite, c'est-à-dire le rapport entre le nombre d'échantillons ayant passé toutes les vérifications et le nombre total d'échantillons dans le test de référence. Dans les tâches de codage, l'efficacité du cadre Nexus a été évaluée sur la base de son efficacité à résoudre les tâches liées à la programmation. L'évaluation utilise les tests de référence HumanEval et VerilogEval-Human.

Le benchmark HumanEval est basé sur une collection de 164 problèmes axés sur la génération de code Python, tandis que VerilogEval-Human contient 156 défis impliquant la génération et la vérification de code Verilog. La figure ci-dessous illustre l'architecture MAS basée sur Nexus pour la résolution des tâches liées au code.

Architecture MAS basée sur le Nexus pour les tâches liées au code

Le tableau ci-dessous montre l'efficacité du flux de travail proposé sur la base des taux de réussite des études d'ablation.

Résultats - 1

Le tableau suivant compare les performances du flux de travail proposé, basé sur Nexus, avec les solutions existantes correspondantes.

Résultats - 2

L'efficacité de Nexus dans la résolution de problèmes mathématiques a été démontrée à l'aide de l'ensemble de données MATH. Le flux de travail suivant a été utilisé, dans lequel les intelligences du superviseur, du mathématicien et de l'examinateur ont été utilisées. Elles sont toutes soutenues par le Claude 3.5v2 LLM apporte son soutien.

Architecture MAS basée sur le Nexus pour les problèmes mathématiques

Résultats des études d'ablation sur l'ensemble de données MATH

Nexus en action : Revue de code et refactorisation

Ensuite, nous démontrons comment construire une architecture MAS avec Nexus pour la revue de code et le refactoring, en utilisant un exemple réel.

Étape 1 : Installer les bibliothèques nécessaires

!git clone https://github.com/PrimisAI/nexus.git
%cd nexus
!pip install -e .

Étape 2 : Importation de la bibliothèque et configuration du LLM

from primisai.nexus.core import Agent, Supervisor
from google.colab import userdata
import os
os.environ["OPENAI_API_KEY"] = userdata.get("OPENAI_API_KEY")
llm_config = {
"api_key": os.getenv("OPENAI_API_KEY"),
"model": "gpt-4o",
"base_url": "https://api.openai.com/v1"
}

Étape 3 : Créer trois intelligences : le superviseur, le réviseur de code et le reformulateur de code.

# 创建主管智能体
coordinator = Supervisor("ProgrammingCoordinator", llm_config)
# 创建代码审查智能体，并设置其系统消息
code_reviewer = Agent(
"CodeReviewer",
llm_config,
system_message="你是一位专注于代码分析的编码专家。你的任务是审查代码，识别错误并提出改进建议。"
)
# 创建代码重构智能体，并设置其系统消息
code_refactor = Agent(
"CodeRefactor",
llm_config,
system_message="你是一位专注于代码重构的编码专家。你的目标是提高代码的可读性和效率。"
)

Étape 4 : Enregistrement des renseignements auprès du coordinateur

coordinator.register_agent(code_reviewer)
coordinator.register_agent(code_refactor)

Étape 5 : Afficher la hiérarchie de l'Intelligentsia

coordinator.display_agent_graph()

Étape 6 : Démarrer une session interactive et fournir un exemple de code Python pour examen et remaniement.

coordinator.start_interactive_session()

exportations

Comme vous pouvez le voir dans le résultat, Nexus a été en mesure de revoir et de remanier notre code Python basé sur l'architecture MAS et a produit une version plus robuste, plus efficace et plus facile à utiliser qui inclut une documentation appropriée.

Résumé et perspectives

Nexus, un cadre Python léger, simplifie considérablement le développement et la gestion des systèmes de multi-intelligence basés sur le LLM. Il permet une intégration transparente, une évolutivité et une flexibilité grâce à une conception modulaire par le biais d'une approche en couches et d'une architecture et de définitions de flux de travail basées sur YAML. Nexus représente une avancée significative dans le développement des systèmes multi-intelligence et promet d'améliorer encore les capacités de résolution de problèmes basées sur le LLM.

À l'avenir, alors que la technologie du LLM continue d'évoluer, le Nexus devrait jouer un rôle plus important dans les domaines suivants :

Traitement de tâches plus complexesAvec des capacités de raisonnement LLM améliorées, Nexus peut gérer des tâches plus complexes et plus difficiles, telles que l'intégration de connaissances inter-domaines, la planification à long terme, etc.
Un plus large éventail de scénarios d'applicationNexus : La flexibilité et l'évolutivité de Nexus lui permettent d'être utilisé dans un plus large éventail d'applications, telles que la fabrication intelligente, les villes intelligentes, la fintech et bien plus encore.
Un soutien communautaire plus fortAvec la promotion de Nexus, davantage de développeurs seront impliqués dans le développement et l'amélioration de Nexus et, ensemble, ils repousseront les limites de la technologie MAS.

Dans l'ensemble, Nexus fournit une plateforme puissante et flexible pour la construction et la gestion de systèmes corporels multi-intelligents, et son émergence accélérera le développement du domaine de l'IA et fournira de nouvelles idées et méthodes pour résoudre des problèmes complexes dans le monde réel.

Référence :https://arxiv.org/pdf/2502.19091

Base de connaissances sur l'IA

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Prompt Jailbreak : Aligned Output Aligned vs Unaligned Benchmark Answers (en anglais)

Commandes d'utilitaires AI # prompt jailbreak

il y a 2 ans

09.1K

Utilisez Coze + Flying Book Forms pour créer un organisateur automatique de données sous forme de tableaux EXCEL !

Tutoriels pratiques sur l'IA

Il y a 8 mois

015.3K

BoT : Amélioration de la pensée : résoudre les problèmes d'essai et d'erreur avec de grands modèles linguistiques

Base de connaissances sur l'IA

il y a 1 an

07.7K

Prompt : Roast My Website GPT permet aux grands modèles linguistiques d'évaluer la qualité d'un site web

Commandes d'utilitaires AI

Il y a 8 mois

010.7K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Nexus : une nouvelle génération de frameworks Python pour construire des systèmes corporels multi-intelligents et évolutifs

Aperçu des systèmes multi-agents (SMA)

Une compréhension plus approfondie du cadre Nexus

Évaluation et analyse des performances de Nexus

Nexus en action : Revue de code et refactorisation

Résumé et perspectives

Interprétation des paramètres clés du grand modèle : jeton, longueur du contexte et limites de sortie

Comment GRPO surpasse o1, o3-mini et R1 dans le jeu "Clue of Time".

Articles connexes

Prompt Jailbreak : Aligned Output Aligned vs Unaligned Benchmark Answers (en anglais)

Utilisez Coze + Flying Book Forms pour créer un organisateur automatique de données sous forme de tableaux EXCEL !

BoT : Amélioration de la pensée : résoudre les problèmes d'essai et d'erreur avec de grands modèles linguistiques

Prompt : Roast My Website GPT permet aux grands modèles linguistiques d'évaluer la qualité d'un site web

Pas de commentaires

Dernières collections

Derniers articles

Nexus : une nouvelle génération de frameworks Python pour construire des systèmes corporels multi-intelligents et évolutifs

Aperçu des systèmes multi-agents (SMA)

Une compréhension plus approfondie du cadre Nexus

Évaluation et analyse des performances de Nexus

Nexus en action : Revue de code et refactorisation

Résumé et perspectives

Interprétation des paramètres clés du grand modèle : jeton, longueur du contexte et limites de sortie

Comment GRPO surpasse o1, o3-mini et R1 dans le jeu "Clue of Time".

Articles connexes

Prompt Jailbreak : Aligned Output Aligned vs Unaligned Benchmark Answers (en anglais)

Utilisez Coze + Flying Book Forms pour créer un organisateur automatique de données sous forme de tableaux EXCEL !

BoT : Amélioration de la pensée : résoudre les problèmes d'essai et d'erreur avec de grands modèles linguistiques

Prompt : Roast My Website GPT permet aux grands modèles linguistiques d'évaluer la qualité d'un site web

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles