Aprendizagem pessoal com IA
e orientação prática
Recomendação de recursos 1

Agent Inbox: uma interface de gerenciamento para interação humano-computador com inteligências de IA

Introdução geral

O Agent Inbox é um projeto de código aberto desenvolvido pela equipe da LangChain para proporcionar uma nova experiência de usuário na interação com inteligências de IA. O projeto permite que os usuários gerenciem e otimizem as interações com várias inteligências de IA por meio de uma interface centralizada. O Agent Inbox oferece suporte a uma ampla variedade de opções de configuração e personalização, permitindo que os usuários adaptem o comportamento e a capacidade de resposta dos agentes às suas necessidades. O objetivo do projeto é simplificar o processo de gerenciamento de inteligências de IA, melhorar a eficiência das interações e proporcionar uma experiência de usuário mais intuitiva.

Versão hospedada on-line: dev.agentinbox.ai


Agent Inbox: uma nova interface de HCI para gerenciar inteligências de IA-1

 

Agent Inbox: uma interface para gerenciar as informações de interação das inteligências de IA-1

 

Lista de funções

  • gerenciamento centralizadoGerencie a interação de várias inteligências de IA por meio de uma única interface.
  • Configuração personalizadaOpções de configuração: Há suporte para várias opções de configuração, permitindo que os usuários ajustem o comportamento do agente de acordo com suas necessidades.
  • resposta em tempo realRegistro em tempo real das respostas e interações do agente: fornece registro em tempo real das respostas e interações do agente.
  • Suporte a vários idiomasSuporte a modos de entrada e saída de interrupção para várias linguagens de programação.
  • projeto de código abertoO código está disponível publicamente e pode ser visualizado, modificado e contribuído livremente pelos usuários.

 

Usando a Ajuda

Processo de instalação

  1. armazém de clones::
   git clone https://github.com/langchain-ai/agent-inbox.git
cd agent-inbox
  1. Instalação de dependências::
   instalação do yarn
  1. Configuração da chave de API::
    • Clique no botão "Settings" (Configurações) na barra lateral e insira a chave da API do LangChain.
    • Crie sua primeira caixa de entrada: Abra a janela pop-up Configurações (canto inferior esquerdo da barra lateral), clique em "Adicionar caixa de entrada" e preencha as informações relevantes.

Processo de uso

  1. Início de projetos::
   início do fio
  1. Conexão com a implantação do LangGraph::
    • Adicione o nome do gráfico LangGraph ou o ID do auxiliar.
    • Digite o URL da implantação do LangGraph.
    • Nomeie a caixa de entrada (opcional).
  2. Gerenciamento de interrupções::
    • Atualize todas as instâncias no código que usam interrupções para serem compatíveis com o Agent Inbox.
    • Defina os modos de entrada e saída de interrupção usando Python ou TypeScript.

Funções principais

  • Aceitação de interrupçõesInterrupção: Aceita os parâmetros ou ações da interrupção e envia um ActionRequest.
  • Interrupção de ediçãoInterrupção: Edite os parâmetros da interrupção e envie o ActionRequest modificado.
  • Ignorar interrupçõesDependendo da configuração, o usuário pode optar por ignorar as interrupções.
  • Resposta a interrupçõesInterrupção: O usuário pode responder de acordo com o tipo de interrupção.

Procedimento de operação detalhado

  1. Configuração do modo de interrupção::
    • Modo de interrupção Python: python
      classe HumanInterrupt(BaseModel).
      ação: str
      args: Dict[str, Any]
    • Modo de interrupção do TypeScript: tipografia
      interface HumanInterrupt {
      action: string;
      args: Registro;
      }
  2. Enviar resposta::
    • Dependendo do tipo de interrupção, a HumanResponse apropriada é enviada: python
      classe HumanResponse(BaseModel).
      action_request: ActionRequest

 

Introdução aos agentes ambientais

A maioria dos aplicativos de IA atuais segue um modelo de bate-papo comum (por exemplo, ChatGPT). Embora sejam fáceis de implementar, eles incorrem em despesas gerais de interação desnecessárias, limitam nossa autoescalabilidade humana e não aproveitam todo o potencial do modelo de linguagem grande (LLM).

Nos últimos seis meses, estamos explorando uma abordagem diferente na LangChain:Agentes ambientais Responda aos sinais do ambiente e solicite a entrada do usuário somente quando for detectada uma oportunidade importante ou quando for necessário um feedback. Em vez de forçar o usuário a entrar em uma nova janela de bate-papo, esses agentes ajudam você a se concentrar no que é mais importante.

Construímos o LangGraph para simplificar a implementação desses padrões. Hoje, compartilhamos nossa primeira implementação de referência: umAssistente de e-mailEle demonstra os principaisAgentes ambientaisPadrões. Nos próximos dias, publicaremos mais exemplos e ferramentas para ajudá-lo a criar seus próprios fluxos de trabalho ambientais.

O que é um agente ambiental?

Ao usar o ChatGPT (ou qualquer outro chatbot) quando eles dependem de você para iniciar um diálogo. Os agentes são iniciados por um ser humano que envia uma mensagem.

Isso é ótimo para alguns casos de uso, mas tem limitações significativas para outros. Exige que o usuário acesse a interface de bate-papo e envie uma mensagem todas as vezes para que o agente realize seu trabalho. Fazer com que o agente comece a trabalhar gera muita sobrecarga.

Outra limitação é que você só pode ter um diálogo por vez. Isso dificulta que nós, humanos, expandamos nossos recursos: um agente só pode fazer uma coisa por nós de cada vez.

Se considerarmos um paradigma de UX que nos permita superar essas limitações, ele deverá apresentar duas características principais:

  • Ele não deve ser acionado (somente) por mensagens humanas
  • Ele deve permitir a execução simultânea de vários agentes

Essas características definem o que chamamos de Agentes ambientais .

💡Agentes ambientais Ouça o fluxo de eventos e aja de acordo, possivelmente em vários eventos ao mesmo tempo

É importante observar que não acreditamos queAgentes ambientaisdeve ser totalmente autônomo. De fato, acreditamos que seráAgentes ambientaisUma parte importante do impulso para o público é a atenção do Quando? também De que forma Esses agentes interagem com os seres humanos.

interação humano-computador

Usamosinteração humano-computadorpara se referir a esses agentes Quando? também De que forma interagindo com humanos. Falaremos sobre isso mais tarde. De que forma Mas agora vamos discutir Quando? .

Geralmente vemosAgentes ambientaisOs três comunsinteração humano-computadorModalidades: notificação, perguntas e revisão.

Aviso: Informe ao usuário que um evento é importante, mas não tome nenhuma ação. Isso é útil para sinalizar eventos que o usuário deve ver, mas o agente não tem autoridade para agir sobre eles. No contexto de um assistente de e-mail, isso pode ser um agente sinalizando um Docusign em minha caixa de entrada - ele não pode assinar esse Docusign, mas eu devo saber que ele existe.

Pergunta: Faça uma pergunta ao usuário para ajudar a desbloquear o agente. O agente pode estar tentando realizar alguma ação, mas não está claro qual a melhor maneira de executá-la porque está faltando alguma informação relevante. Em vez de alucinar ou adivinhar, é melhor fazer com que o agente pergunte diretamente ao ser humano o que fazer. No contexto de um assistente de e-mail, isso pode ser um agente perguntando se eu quero participar de uma reunião. A menos que o prompt tenha instruções para o agente sobre minhas preferências de reunião, ele não pode saber. Um EA humano me perguntaria, e um agente também deveria.

Revisão: Analise as ações que o agente deseja realizar. Algumas ações são "perigosas" o suficiente para que valha a pena codificar uma revisão para qualquer ação que o agente queira realizar. O humano pode aprovar a ação, editá-la diretamente ou fornecer feedback direto ao agente sobre como alterá-la. No contexto de um assistente de e-mail, isso pode ser um e-mail de saída. Ele pode escrever um rascunho, mas eu tenho que aprová-lo, editar o conteúdo da mensagem diretamente ou dizer ao agente para corrigi-lo de alguma forma.

A importância da interação humano-computador

Acreditamos queinteração humano-computadorComponentes paraAgentes ambientaistraz três benefícios principais:

  1. Ele reduz o risco e facilita a entrada em produção dos agentes
  2. Ele imita a comunicação humana para aumentar a confiança e a adoção do usuário
  3. Melhora a memória e o aprendizado de longo prazo

A HCI reduz os riscos. Se um agente estiver sendo executado de forma totalmente autônoma em segundo plano, ele realmente não poderá cometer erros. Você precisa confiar muito no agente para permitir que ele execute determinadas ações (por exemplo, atualizar bancos de dados, enviar e-mails para clientes importantes etc.). Cominteração humano-computadorVocê pode controlar facilmente essas operações e solicitar aprovação manual explícita. Dessa forma, você pode ter certeza de que não enviará e-mails errados.

A HCI imita a maneira como os seres humanos se comunicam. Uma parte importante do trabalho com outras pessoas é a comunicação com elas. Quando você estiver hesitante, faça perguntas e deixe que eles o ajudem a considerar ideias. Se tivermos "colegas" que são procuradores, fazer com que eles se comuniquem de modo semelhante gera confiança no usuário, o que promove a adoção. Considere algo como Devin Algo parecido com isso. Eles escolhem usuários com Devin Uma das principais interfaces de interação é o Slack. É lá que interagimos com os desenvolvedores humanos, então por que não deveríamos interagir com os desenvolvedores de IA dessa forma? A comunicação é importante.

A interação humano-computador aprimora a memória de longo prazo e o aprendizado. Acreditamos firmemente que uma parte fundamental dos agentes de IA é sua capacidade de aprender e se alinhar melhor com os usuários humanos ao longo do tempo. Para alcançar essa consistência, eles precisam de alguma forma de feedback do usuário. Esse tipo deinteração humano-computadorO componente fornece esse feedback.

Caixa de entrada do proxy

Assim, discutimos que os agentes devem Quando? Comunicação com humanos ( notificações(matemática) gênero fazer perguntas(matemática) gênero censurar ), mas não discutimos que eles deveriam De que forma Comunicação.

em julgamentoAgentes ambientaisQuando se trata do Slack, começamos inicialmente com o Slack. A principal vantagem foi que todos nós já estávamos usando o Slack em nosso trabalho diário, portanto, foi uma maneira eficaz de chamar nossa atenção e manter o foco na comunicação com nossos humanos.

A desvantagem do Slack é que é fácil perder todas as notificações. Se você não responder a algumas notificações, o acúmulo de notificações do Slack aumentará. O canal (ou DM) do Slack não é o mais fácil de navegar. Ele também tem limitações na forma como você pode se comunicar com os agentes - você pode facilmente enviar mensagens a eles, mas qualquer outra coisa é mais complicada.

Recorremos ao que chamamos de "caixa de entrada proxy". Isso é o mesmo queAgentes ambientaisNova UX interativa. É modelada com uma combinação de caixa de entrada de e-mail e sistema de emissão de tíquetes de suporte ao cliente. Mostra todas as linhas de comunicação abertas entre você e o agente, facilitando o rastreamento de quaisquer ações pendentes. É uma interface de usuário autônoma que facilita a adição de painéis, botões ou outros recursos de interface de usuário, permitindo que você capture o feedback do usuário com mais facilidade. No momento, os itens são classificados apenas por tempo, mas, no futuro, você poderá classificá-los por prioridade. No momento, essa caixa de entrada é para um único jogador, mas no futuro você poderá ver quais itens foram atribuídos a você e quais foram atribuídos a outras pessoas.

Observação: a implementação de código aberto da caixa de entrada do proxy será lançada na quinta-feira (já).

 

Por que o LangGraph é ótimo para agentes ambientais

Antes de criarmos oAgentes ambientaisNós nos certificamos de que o LangGraph seja capaz de suportar esses tipos de agentes. Plataforma LangGraph ) tem alguns recursos importantes que talvez você não queira criar por conta própria:

embutidocamada de persistência. O LangGraph é apoiado por uma camada de persistência que mantém o estado do agente entre cada operação (ou nó do gráfico). Isso permite que o agente faça uma "pausa" e aguarde o feedback do usuário. Isso é útil para permitirinteração humano-computadorOs padrões, bem como a memória de diálogo de curto prazo, são muito importantes.

embutidoSuporte à interação homem-computador. LangGraph suporte nativointeração humano-computadorPadrões. A camada de persistência integrada é uma parte importante disso, mas também adicionamos recentemente a camada de persistência "Interrupções". Esse é um novo método integrado de comunicação com os usuários finais.

embutidoMemória de longo prazo. O LangGraph tem memória de longo prazo integrada (essencialmente um armazenamento de valores-chave de namespace com suporte para pesquisa semântica). Isso permite que o agente use ointeração humano-computadorÉ fácil atualizar sua "memória" depois.

Tarefas Cron. MuitosAgentes ambientaisExecutar em um cronograma para verificar se há novos eventos. A plataforma LangGraph vem com uma tarefa cron integrada para dar suporte a isso.

Criação de um assistente de e-mail com IA

Ao construir nosso cotidianoAgentes ambientaisTornamos o LangGraph muito adequado para construir oAgentes ambientaisUm dos principais é um assistente de e-mail. Um dos principais é um assistente de e-mail. Se você entrou em contato comigo nos últimos seis meses, há uma boa chance de que o agente de IA tenha redigido esse e-mail (e se eu o ignorei, a culpa deve ser do agente de IA).

Hoje estamos lançando esse auxiliar de e-mail, que é um agente de e-mail hospedado de uso gratuito e um projeto de código aberto. Queremos que os agentes de e-mail hospedados sejam fáceis de testar e experimentar!Agentes ambientaise a versão de código aberto pode servir como uma implementação de referência desse novo paradigma de design.

Conteúdo 2
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Agent Inbox: uma interface de gerenciamento para interação humano-computador com inteligências de IA

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil