Agent Inbox: una interfaz de gestión para la interacción persona-ordenador con inteligencias IA

Últimos recursos sobre IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

57.1K 00

Introducción general

Agent Inbox es un proyecto de código abierto desarrollado por el equipo de LangChain para ofrecer una nueva experiencia de usuario a la hora de interactuar con inteligencias artificiales. El proyecto permite a los usuarios gestionar y optimizar las interacciones con múltiples inteligencias IA a través de una interfaz centralizada. Agent Inbox admite una amplia gama de opciones de configuración y personalización, lo que permite a los usuarios adaptar el comportamiento y la capacidad de respuesta de los agentes a sus necesidades. El objetivo del proyecto es simplificar el proceso de gestión de las inteligencias artificiales, mejorar la eficacia de las interacciones y ofrecer una experiencia de usuario más intuitiva.

Versión alojada en línea: dev.agentinbox.ai

Lista de funciones

gestión centralizada: Gestiona la interacción de múltiples inteligencias IA a través de una única interfaz.
Configuración personalizada: Se admiten diversas opciones de configuración, lo que permite a los usuarios ajustar el comportamiento del agente en función de sus necesidades.
respuesta en tiempo real: Proporciona registro en tiempo real de las respuestas e interacciones de los agentes.
Soporte multilingüe: Admite modos de entrada y salida de interrupción para múltiples lenguajes de programación.
proyecto de código abiertoEl código es público y los usuarios pueden verlo, modificarlo y contribuir a él.

Utilizar la ayuda

Proceso de instalación

almacén de clones::

   git clone https://github.com/langchain-ai/agent-inbox.git
cd agent-inbox

Instalación de dependencias::

   yarn install

Configuración de la clave API::
- Haz clic en el botón "Configuración" de la barra lateral e introduce la clave API de LangChain.
- Cree su primera bandeja de entrada: Abra la ventana emergente Configuración (esquina inferior izquierda de la barra lateral), haga clic en "Añadir bandeja de entrada" y rellene la información pertinente.

Proceso de utilización

Inicio de proyectos::

   yarn start

Conexión a LangGraph Deployment::
- Añade el nombre del gráfico LangGraph o el ID del ayudante.
- Introduzca la URL del despliegue de LangGraph.
- Nombre de la bandeja de entrada (opcional).
Gestionar las interrupciones::
- Actualice todas las instancias del código que utilizan interrupciones para que sean compatibles con la Bandeja de entrada del agente.
- Define los modos de entrada y salida de interrupciones utilizando Python o TypeScript.

Funciones principales

Aceptación de las interrupciones: Acepta los parámetros o acciones de la interrupción y envía una ActionRequest.
Editar Interrupción: Edita los parámetros de la interrupción y envía la ActionRequest modificada.
Ignorar las interrupciones: Dependiendo de la configuración, el usuario puede elegir ignorar las interrupciones.
Responder a las interrupcionesEl usuario puede responder según el tipo de interrupción.

Procedimiento de funcionamiento detallado

Configuración del modo de interrupción::
- Modo de interrupción Python: python class HumanInterrupt(BaseModel): action: str args: Dict[str, Any]
- Modo de interrupción de TypeScript: typescript interface HumanInterrupt { action: string; args: Record<string, any>; }
Enviar respuesta::
- En función del tipo de interrupción, se envía la HumanResponse adecuada: python class HumanResponse(BaseModel): action_request: ActionRequest

Introducción a los agentes ambientales

La mayoría de las aplicaciones de IA actuales siguen un modelo de chat común (por ejemplo, ChatGPT). Aunque son fáciles de implementar, incurren en sobrecargas de interacción innecesarias, limitan nuestra autoescalabilidad humana y no aprovechan todo el potencial del Modelo de Lenguaje Grande (LLM).

En los últimos seis meses, hemos estado explorando un enfoque diferente en LangChain:Agentes medioambientales Responden a las señales del entorno y requieren la intervención del usuario sólo cuando se detecta una oportunidad importante o se necesita retroalimentación. En lugar de forzar al usuario a entrar en una nueva ventana de chat, estos agentes le ayudan a centrarse en lo que más importa.

Construimos el LangGraph para simplificar la implementación de estos patrones. Hoy compartimos nuestra primera implementación de referencia: unAsistente de correo electrónicoDemuestra la claveAgentes medioambientalesPatrones. En los próximos días publicaremos más ejemplos y herramientas que le ayudarán a crear sus propios flujos de trabajo medioambientales.

¿Qué es un agente medioambiental?

Al utilizar el ChatGPT (o cualquier otro chatbot) cuando dependen de ti para iniciar un diálogo. Los agentes son iniciados por un humano que envía un mensaje.

Esto es estupendo para algunos casos de uso, pero tiene importantes limitaciones para otros. Requiere que el usuario entre en la interfaz de chat y envíe un mensaje cada vez para que el agente realice su trabajo. Conseguir que el agente empiece a trabajar supone una gran sobrecarga.

Otra limitación es que sólo se puede tener un diálogo a la vez. Esto nos dificulta a los humanos ampliar nuestras capacidades: un agente sólo puede hacer una cosa por nosotros a la vez.

Si consideramos un paradigma de UX que nos permita superar estas limitaciones, debería presentar dos características clave:

No debe activarse (sólo) por mensajes humanos
Debe permitir la ejecución simultánea de varios agentes

Estas características definen lo que llamamos Agentes medioambientales .

💡Agentes medioambientales Escuchar el flujo de eventos y actuar en consecuencia, posiblemente en varios eventos al mismo tiempo.

Cabe señalar que no creemos queAgentes medioambientalesdebe ser totalmente autónoma. De hecho, creemos que seráAgentes medioambientalesUna parte clave del empuje hacia el público es la consideración del ¿Cuándo? demasiado de qué manera Estos agentes interactúan con los seres humanos.

interacción persona-ordenador

Utilizamosinteracción persona-ordenadorpara referirse a estos agentes ¿Cuándo? demasiado de qué manera interactuando con los humanos. Hablaremos de ello más adelante. de qué manera Pero ahora hablemos de ¿Cuándo? .

Solemos verAgentes medioambientalesLos tresinteracción persona-ordenadorModalidades: notificación, preguntas y revisión.

Aviso: Hacer saber al usuario que un evento es importante, pero no realizar ninguna acción. Esto es útil para marcar eventos que el usuario debería ver, pero el agente no tiene autoridad para actuar sobre ellos. En el contexto de un asistente de correo electrónico, esto podría ser un agente marcando un Docusign en mi bandeja de entrada: no puede firmar ese Docusign, pero yo debería saber que existe.

Pregunta: Haz una pregunta al usuario para ayudar a desbloquear al agente. El agente puede estar intentando realizar alguna acción, pero no tiene claro cuál es la mejor forma de llevarla a cabo porque le falta alguna información relevante. En lugar de alucinar o adivinar, es mejor que el agente pregunte directamente al humano qué debe hacer. En el contexto de un asistente de correo electrónico, esto podría ser un agente que me preguntara si quiero asistir a una reunión. A menos que el agente reciba instrucciones sobre mis preferencias de reunión, es imposible que lo sepa. Un EA humano me lo preguntaría, y lo mismo debería hacer un agente.

Revisión: Revisar las acciones que el agente quiere realizar. Algunas acciones son lo suficientemente "peligrosas" como para que merezca la pena codificar una revisión para cualquier acción que el agente quiera realizar. Un humano podría aprobar la acción, editarla directamente o proporcionar información directa al agente sobre cómo cambiarla. En el contexto de un asistente de correo electrónico, esto podría ser un correo electrónico saliente. Podría escribir un borrador, pero tengo que aprobarlo, editar directamente el contenido del mensaje o decirle al agente que lo arregle de alguna manera.

La importancia de la interacción persona-ordenador

Creemos queinteracción persona-ordenadorComponentes paraAgentes medioambientalesaporta tres ventajas fundamentales:

Reduce el riesgo y facilita la entrada en producción de los agentes
Imita la comunicación humana para fomentar la confianza del usuario y su adopción.
Mejora la memoria a largo plazo y el aprendizaje

La HCI reduce el riesgo. Si un agente funciona de forma completamente autónoma en segundo plano, realmente no puede cometer errores. Hay que confiar mucho en el agente para dejarle realizar determinadas acciones (por ejemplo, actualizar bases de datos, enviar correos electrónicos a clientes importantes, etc.). Coninteracción persona-ordenadorPuede controlar fácilmente estas operaciones y solicitar una aprobación manual explícita. Así te asegurarás de no enviar correos electrónicos equivocados.

La HCI imita la forma de comunicarse de los humanos. Una parte importante del trabajo con los demás es comunicarse con ellos. Cuando tengas dudas, hazles preguntas y deja que te ayuden a considerar ideas. Si tenemos "colegas" que son apoderados, hacer que se comuniquen de un modo similar genera confianza en el usuario, lo que favorece la adopción. Piense en algo como Devin Algo así. Eligen usuarios con Devin Una de las principales interfaces de interacción es Slack. Ahí es donde interactuamos con los desarrolladores humanos, así que ¿por qué no íbamos a interactuar así con los desarrolladores de IA? La comunicación es importante.

La interacción persona-ordenador mejora la memoria a largo plazo y el aprendizaje. Creemos firmemente que una parte clave de los agentes de IA es su capacidad para aprender y alinearse mejor con los usuarios humanos a lo largo del tiempo. Para lograr esta coherencia, necesitan algún tipo de retroalimentación de los usuarios. Este tipo deinteracción persona-ordenadorEl componente proporciona esta información.

Bandeja de entrada de proxy

Así, hemos debatido que los agentes deben ¿Cuándo? Comunicación con los seres humanos ( notificaciones(matemáticas) género hacer preguntas(matemáticas) género censurar ), pero no discutimos que debían de qué manera Comunicación.

a pruebaAgentes medioambientalesEn cuanto a Slack, al principio empezamos con Slack. La principal ventaja era que todos ya utilizábamos Slack para nuestro trabajo diario, por lo que era una forma eficaz de captar nuestra atención y mantenernos centrados en la comunicación con nuestros seres humanos.

El inconveniente de Slack es que es fácil perderse todas las notificaciones. Si no respondes a algunas notificaciones, la acumulación de notificaciones de Slack crece.El canal de Slack (o DM) no es el más fácil de navegar. También tiene limitaciones a la hora de comunicarte con los agentes: puedes enviarles mensajes fácilmente, pero cualquier otra cosa es más complicada.

Hemos pasado a lo que llamamos "bandeja de entrada proxy". Es lo mismo queAgentes medioambientalesNueva UX interactiva. Está modelada con una combinación de bandeja de entrada de correo electrónico y sistema de tickets de atención al cliente. Muestra todas las líneas de comunicación abiertas entre usted y el agente, lo que facilita el seguimiento de cualquier acción pendiente. Se trata de una interfaz de usuario independiente que facilita la adición de paneles, botones u otras funciones de interfaz de usuario, lo que permite captar más fácilmente los comentarios de los usuarios. Actualmente, los elementos sólo se ordenan por tiempo, pero en el futuro podrás ordenarlos por prioridad. Actualmente, esta bandeja de entrada es individual, pero en el futuro podrás ver qué elementos se te han asignado y cuáles se han asignado a otros.

Nota: La implementación de código abierto de la bandeja de entrada proxy se publicará el jueves (ya).

Por qué LangGraph es excelente para los agentes medioambientales

Antes de construir elAgentes medioambientalesNos aseguramos de que LangGraph sea capaz de soportar este tipo de agentes. Plataforma LangGraph ) tiene algunas características clave que quizá no quieras construir tú mismo:

integradocapa de persistencia. LangGraph está respaldado por una capa de persistencia que mantiene el estado del agente entre cada operación (o nodo del grafo). Esto permite al agente esencialmente "hacer una pausa" y esperar la respuesta del usuario. Esto es útil para permitirinteracción persona-ordenadorLos patrones, así como la memoria de diálogo a corto plazo, son muy importantes.

integradoApoyo a la interacción persona-ordenador. Soporte nativo de LangGraphinteracción persona-ordenadorPatrones. La capa de persistencia incorporada es una parte importante de todo esto, pero también hemos añadido recientemente la función "Interrupciones". Se trata de un nuevo método integrado de comunicación con los usuarios finales.

integradoMemoria a largo plazo. LangGraph incorpora una memoria a largo plazo (esencialmente un almacén de claves y valores del espacio de nombres con soporte para la búsqueda semántica). Esto permite a los agentes utilizar lainteracción persona-ordenadorEs fácil actualizar su "memoria" después.

Tareas Cron. MuchosAgentes medioambientalesEjecutar en un horario para comprobar si hay nuevos eventos. la Plataforma LangGraph viene con una tarea cron incorporado para apoyar esto.

Creación de un asistente de correo electrónico con inteligencia artificial

Al construir nuestro día a díaAgentes medioambientalesHemos hecho que LangGraph sea muy adecuado para construir elAgentes medioambientalesUno de los principales es un asistente de correo electrónico. Uno de los principales es un asistente de correo electrónico. Si te has puesto en contacto conmigo en los últimos seis meses, es muy probable que el agente de IA haya redactado ese correo electrónico (y si te he pasado por alto, debe ser culpa del agente de IA).

Hoy lanzamos este ayudante de correo electrónico, que es tanto un agente de correo electrónico alojado de uso gratuito como un proyecto de código abierto. Queremos que los agentes de correo electrónico alojados sean fáciles de probar y experimentar.Agentes medioambientalesy la versión de código abierto puede servir como implementación de referencia de este nuevo paradigma de diseño.