Agent Inbox : une interface de gestion pour l'interaction homme-machine avec les intelligences IA

Introduction générale

Agent Inbox est un projet open source développé par l'équipe LangChain pour fournir une nouvelle expérience utilisateur pour l'interaction avec les intelligences artificielles. Le projet permet aux utilisateurs de gérer et d'optimiser les interactions avec plusieurs intelligences IA à travers une interface centralisée. Agent Inbox supporte un large éventail d'options de configuration et de personnalisation, permettant aux utilisateurs d'adapter le comportement et la réactivité des agents à leurs besoins. L'objectif du projet est de simplifier le processus de gestion des intelligences artificielles, d'améliorer l'efficacité des interactions et d'offrir une expérience utilisateur plus intuitive.

Version hébergée en ligne : dev.agentinbox.ai

Agent Inbox:与AI智能体进行人机交互的管理界面

 

Agent Inbox:与AI智能体进行人机交互的管理界面

 

Liste des fonctions

  • gestion centraliséeLa gestion de l'intelligence artificielle : gérer l'interaction de plusieurs intelligences artificielles par le biais d'une interface unique.
  • Configuration personnaliséeLes agents peuvent être configurés de différentes manières, ce qui permet aux utilisateurs d'adapter le comportement de l'agent en fonction de leurs besoins.
  • réponse en temps réelLe système d'enregistrement des réponses et des interactions de l'agent en temps réel.
  • Prise en charge multilingueLe système de gestion de l'information de la Commission européenne (CEI) permet de gérer les modes d'entrée et de sortie d'interruption pour de nombreux langages de programmation.
  • projet open sourceLe code est accessible au public et les utilisateurs sont libres de le consulter, de le modifier et d'y contribuer.

 

Utiliser l'aide

Processus d'installation

  1. entrepôt de clones: :
   git clone https://github.com/langchain-ai/agent-inbox.git
cd agent-inbox
  1. Installation des dépendances: :
   yarn install
  1. Configuration de la clé API: :
    • Cliquez sur le bouton "Settings" dans la barre latérale et entrez la clé API LangChain.
    • Créez votre première boîte de réception : ouvrez la fenêtre contextuelle des paramètres (en bas à gauche de la barre latérale), cliquez sur "Ajouter une boîte de réception" et remplissez les informations pertinentes.

Processus d'utilisation

  1. Lancement de projets: :
   yarn start
  1. Connexion au déploiement de LangGraph: :
    • Ajouter le nom du graphe LangGraph ou l'ID de l'aide.
    • Entrez l'URL du déploiement de LangGraph.
    • Nom de la boîte de réception (facultatif).
  2. Gérer les interruptions: :
    • Mettre à jour toutes les instances du code qui utilisent des interruptions pour qu'elles soient compatibles avec l'Agent Inbox.
    • Définir les modes d'entrée et de sortie des interruptions à l'aide de Python ou TypeScript.

Principales fonctions

  • Acceptation des interruptionsLe système de gestion de l'interruption : accepte les paramètres ou les actions de l'interruption et envoie une demande d'action (ActionRequest).
  • Modifier l'interruptionLa demande d'action modifiée : modifie les paramètres de l'interruption et envoie la demande d'action modifiée.
  • Ignorer les interruptionsL'utilisateur peut choisir d'ignorer les interruptions en fonction de la configuration.
  • Répondre aux interruptionsL'utilisateur peut répondre en fonction du type d'interruption.

Procédure d'utilisation détaillée

  1. Configuration du mode d'interruption: :
    • Mode d'interruption Python : python
      class HumanInterrupt(BaseModel):
      action: str
      args: Dict[str, Any]
    • Mode d'interruption TypeScript : typescript
      interface HumanInterrupt {
      action: string;
      args: Record<string, any>;
      }
  2. Envoyer la réponse: :
    • En fonction du type d'interruption, la réponse humaine appropriée est envoyée : python
      class HumanResponse(BaseModel):
      action_request: ActionRequest

 

Introduction aux agents d'ambiance

La plupart des applications d'IA actuelles suivent un modèle de chat commun (par exemple ChatGPT). Bien qu'elles soient faciles à mettre en œuvre, elles entraînent des frais généraux d'interaction inutiles, limitent l'évolutivité de l'humain et ne parviennent pas à tirer pleinement parti du potentiel du grand modèle linguistique (LLM).

Au cours des six derniers mois, nous avons exploré une approche différente chez LangChain :Agents environnementaux Ils réagissent aux signaux environnementaux et ne demandent l'intervention de l'utilisateur que lorsqu'une opportunité importante est détectée ou qu'un retour d'information est nécessaire. Plutôt que de forcer l'utilisateur à entrer dans une nouvelle fenêtre de discussion, ces agents vous aident à vous concentrer sur ce qui compte le plus.

Nous avons construit le LangGraph pour simplifier la mise en œuvre de ces modèles. Aujourd'hui, nous partageons notre première implémentation de référence : unAssistant e-mailIl démontre les principalesAgents environnementauxModèles. Au cours des prochains jours, nous publierons d'autres exemples et outils pour vous aider à créer vos propres flux de travail environnementaux.

Qu'est-ce qu'un agent environnemental ?

Lors de l'utilisation du ChatGPT (ou tout autre chatbot) lorsqu'ils comptent sur vous pour entamer un dialogue. Les agents sont initiés par un humain qui envoie un message.

Cette solution est idéale pour certains cas d'utilisation, mais présente des limites importantes pour d'autres. L'utilisateur doit aller dans l'interface de discussion et envoyer un message à chaque fois pour que l'agent puisse effectuer son travail. Faire en sorte que l'agent commence à travailler entraîne beaucoup de frais généraux.

Une autre limitation est que vous ne pouvez avoir qu'un seul dialogue à la fois. Il est donc difficile pour nous, les humains, d'étendre nos capacités : un agent ne peut faire qu'une seule chose à la fois pour nous.

Si nous considérons un paradigme UX qui nous permet de surmonter ces limitations, il devrait présenter deux caractéristiques clés :

  • Il ne doit pas être déclenché (uniquement) par des messages humains.
  • Il doit permettre à plusieurs agents de fonctionner simultanément

Ces caractéristiques définissent ce que nous appelons Agents environnementaux .

💡Agents environnementaux Écouter le flux d'événements et agir en conséquence, éventuellement sur plusieurs événements en même temps

Il convient de noter que nous ne pensons pas que lesAgents environnementauxdoit être totalement autonome. En fait, nous pensons qu'il seraAgents environnementauxUn élément clé de l'impulsion donnée au public est le caractère réfléchi de l'action de la Commission européenne. quand ? aussi de quelle manière Ces agents interagissent avec les humains.

l'interaction homme-machine

Nous utilisonsl'interaction homme-machinepour se référer à ces agents quand ? aussi de quelle manière l'interaction avec les humains. Nous y reviendrons plus tard. de quelle manière Mais parlons maintenant quand ? .

Nous voyons généralementAgents environnementauxLes trois catégories de produits les plus courantesl'interaction homme-machineModalités : notification, questions et examen.

Avis : Indiquer à l'utilisateur qu'un événement est important, mais ne prendre aucune mesure. Cette fonction est utile pour signaler des événements que l'utilisateur devrait voir, mais pour lesquels l'agent n'a pas le pouvoir d'agir. Dans le contexte d'un assistant de messagerie, il peut s'agir d'un agent qui signale un Docusign dans ma boîte de réception - il ne peut pas signer ce Docusign, mais je dois savoir qu'il existe.

Question : Posez une question à l'utilisateur pour l'aider à débloquer l'agent. Il se peut que l'agent essaie d'effectuer une action, mais qu'il ne sache pas exactement comment l'exécuter au mieux parce qu'il lui manque des informations pertinentes. Au lieu d'halluciner ou de deviner, il est préférable que l'agent demande directement à l'humain ce qu'il doit faire. Dans le contexte d'un assistant de messagerie, il pourrait s'agir d'un agent qui me demanderait si je souhaite participer à une réunion. À moins que l'invite n'ait donné des instructions à l'agent sur mes préférences en matière de réunions, il ne peut pas le savoir. Un EA humain me le demanderait, et un agent devrait faire de même.

Révision : Examiner les actions que l'agent veut entreprendre. Certaines actions sont suffisamment "dangereuses" pour qu'il vaille la peine de coder en dur une révision pour toute action que l'agent souhaite entreprendre. Un humain pourrait approuver l'action, la modifier directement ou fournir un retour d'information direct à l'agent sur la manière de la modifier. Dans le contexte d'un assistant de messagerie, il pourrait s'agir d'un courrier électronique sortant. Il peut rédiger un brouillon, mais je dois l'approuver, modifier directement le contenu du message ou demander à l'agent de le corriger d'une manière ou d'une autre.

L'importance de l'interaction homme-machine

Nous pensons quel'interaction homme-machineComposants pourAgents environnementauxapporte trois avantages essentiels :

  1. Il réduit les risques et facilite la mise en production des agents.
  2. Il imite la communication humaine pour renforcer la confiance et l'adoption des utilisateurs.
  3. Il améliore la mémoire à long terme et l'apprentissage

HCI réduit les risques. Si un agent fonctionne de manière totalement autonome en arrière-plan, il n'a pas vraiment le droit à l'erreur. Il faut faire confiance à l'agent pour lui permettre d'effectuer certaines actions (par exemple, mettre à jour des bases de données, envoyer des courriels à des clients importants, etc.) Avecl'interaction homme-machineVous pouvez facilement contrôler ces opérations et demander une approbation manuelle explicite. De cette façon, vous pouvez vous assurer que vous n'envoyez pas les mauvais courriels.

L'IHM imite la façon dont les humains communiquent. Une part importante du travail avec les autres consiste à communiquer avec eux. Lorsque vous hésitez, posez-leur des questions et laissez-les vous aider à réfléchir à des idées. Si nous avons des "collègues" qui sont des mandataires, le fait qu'ils communiquent dans un mode similaire renforce la confiance des utilisateurs, ce qui favorise l'adoption. Pensez à quelque chose comme Devin Voici ce qu'il en est. Ils choisissent des utilisateurs ayant Devin L'une des principales interfaces d'interaction est Slack. C'est là que nous interagissons avec les développeurs humains, alors pourquoi ne pourrions-nous pas interagir avec les développeurs IA de la même manière ? La communication est importante.

L'interaction homme-machine améliore la mémoire à long terme et l'apprentissage. Nous sommes convaincus qu'un élément clé des agents d'intelligence artificielle est leur capacité à apprendre et à mieux s'aligner sur les utilisateurs humains au fil du temps. Pour parvenir à cette cohérence, ils ont besoin d'une certaine forme de retour d'information de la part des utilisateurs. Ce type del'interaction homme-machineLe composant fournit ce retour d'information.

Boîte de réception Proxy

Ainsi, nous avons discuté du fait que les agents devraient quand ? Communication avec les humains ( notifications(math.) genre poser des questions(math.) genre censurer ), mais nous n'avons pas discuté du fait qu'ils devraient de quelle manière Communication.

en procèsAgents environnementauxPour ce qui est de Slack, nous avons d'abord commencé par l'utiliser. Le principal avantage était que nous utilisions déjà tous Slack pour notre travail quotidien, et que c'était donc un moyen efficace d'attirer notre attention et de rester concentrés sur la communication avec nos humains.

L'inconvénient de Slack est qu'il est facile de manquer toutes les notifications. Si vous ne répondez pas à certaines notifications, l'arriéré de notifications Slack augmente. Le canal Slack (ou DM) n'est pas le plus facile à naviguer. Le canal Slack (ou DM) n'est pas le plus facile à naviguer. Il présente également des limites quant à la manière de communiquer avec les agents : vous pouvez facilement leur envoyer des messages, mais tout le reste est plus délicat.

Nous nous sommes tournés vers ce que nous appelons la "boîte de réception proxy". C'est la même chose queAgents environnementauxNouvelle interface utilisateur interactive. Elle est modélisée par une combinaison de boîte de réception d'e-mails et de système de billetterie d'assistance à la clientèle. Il affiche toutes les lignes de communication ouvertes entre vous et l'agent, ce qui facilite le suivi des actions en cours. Il s'agit d'une interface utilisateur autonome qui permet d'ajouter facilement des panneaux, des boutons ou d'autres fonctions d'interface utilisateur, ce qui vous permet de recueillir plus facilement les commentaires des utilisateurs. Actuellement, les éléments sont uniquement triés par heure, mais à l'avenir, vous pourrez les trier par priorité. Actuellement, cette boîte de réception est mono-joueur, mais à l'avenir, vous pourrez voir les éléments qui vous ont été attribués et ceux qui ont été attribués à d'autres.

Agent Inbox:与AI智能体进行人机交互的管理界面

Note : L'implémentation open source de la boîte de réception proxy sera publiée jeudi (déjà).

 

Pourquoi LangGraph est idéal pour les agents environnementaux

Avant de construire leAgents environnementauxNous nous assurons que LangGraph est capable de prendre en charge ces types d'agents. Plate-forme LangGraph ) présente certaines caractéristiques essentielles que vous ne voudrez peut-être pas construire vous-même :

intégrécouche de persistance. LangGraph s'appuie sur une couche de persistance qui conserve l'état de l'agent entre chaque opération (ou nœud du graphe). Cela permet à l'agent de faire une pause et d'attendre les réactions de l'utilisateur. Ceci est utile pour permettre àl'interaction homme-machineLes schémas ainsi que la mémoire de dialogue à court terme sont très importants.

intégréSoutien à l'interaction homme-machine. Support natif LangGraphl'interaction homme-machineLes modèles. La couche de persistance intégrée en est un élément important, mais nous avons également ajouté récemment la fonction "Interruptions". Il s'agit d'une nouvelle méthode intégrée de communication avec les utilisateurs finaux.

intégréMémoire à long terme. LangGraph dispose d'une mémoire à long terme intégrée (essentiellement une mémoire clé-valeur de l'espace de noms avec prise en charge de la recherche sémantique). Cela permet aux agents d'utiliser lal'interaction homme-machineIl est facile de mettre à jour sa "mémoire" par la suite.

Tâches Cron. NombreuxAgents environnementauxExécuter un programme pour vérifier les nouveaux événements. La plate-forme LangGraph est dotée d'une tâche cron intégrée pour prendre en charge cette fonction.

Création d'un assistant électronique IA

En construisant notre quotidienAgents environnementauxNous avons fait en sorte que LangGraph soit parfaitement adapté à la construction de la base de données desAgents environnementauxL'un des principaux est un assistant de messagerie. L'un des principaux est un assistant de messagerie. Si vous m'avez contacté au cours des six derniers mois, il y a de fortes chances que l'agent IA ait rédigé ce courriel (et si je vous ai oublié, ce doit être la faute de l'agent IA).

Aujourd'hui, nous lançons cette aide à la messagerie, qui est à la fois un agent de messagerie hébergé gratuit et un projet open source. Nous voulons que les agents de messagerie hébergés soient faciles à essayer et à expérimenter !Agents environnementauxet la version open source peut servir de référence pour la mise en œuvre de ce nouveau paradigme de conception.

© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...