Agent Inbox: eine Verwaltungsschnittstelle für die Mensch-Computer-Interaktion mit KI-Intelligenzen

Neueste AI-RessourcenAktualisiert vor 8 Monaten AI-Austauschkreis

20.6K 00

Allgemeine Einführung

Agent Inbox ist ein Open-Source-Projekt, das vom LangChain-Team entwickelt wurde, um eine neue Benutzererfahrung für die Interaktion mit KI-Intelligenzen zu schaffen. Das Projekt ermöglicht es Nutzern, Interaktionen mit mehreren KI-Intelligenzen über eine zentrale Schnittstelle zu verwalten und zu optimieren. Agent Inbox unterstützt eine breite Palette von Konfigurations- und Anpassungsoptionen, die es Nutzern ermöglichen, das Verhalten und die Reaktionsfähigkeit von Agenten an ihre Bedürfnisse anzupassen. Ziel des Projekts ist es, den Prozess der Verwaltung von KI-Intelligenzen zu vereinfachen, die Effizienz der Interaktionen zu verbessern und eine intuitivere Benutzererfahrung zu bieten.

Online gehostete Version: dev.agentinbox.ai

Funktionsliste

zentralisierte VerwaltungVerwaltung der Interaktion mehrerer KI-Intelligenzen über eine einzige Schnittstelle.
Benutzerdefinierte KonfigurationEine Vielzahl von Konfigurationsoptionen wird unterstützt, die es dem Benutzer ermöglichen, das Verhalten des Agenten an seine Bedürfnisse anzupassen.
Echtzeit-ReaktionBietet eine Echtzeit-Protokollierung von Agentenantworten und -interaktionen.
Unterstützung mehrerer SprachenUnterstützt Interrupt-Eingabe- und -Ausgabemodi für mehrere Programmiersprachen.
Open-Source-ProjektDer Code ist öffentlich zugänglich und kann von den Benutzern frei eingesehen, verändert und ergänzt werden.

Hilfe verwenden

Einbauverfahren

Klon-Lager::

   git clone https://github.com/langchain-ai/agent-inbox.git
cd agent-inbox

Installation von Abhängigkeiten::

   yarn install

Konfigurieren des API-Schlüssels::
- Klicken Sie auf die Schaltfläche "Einstellungen" in der Seitenleiste und geben Sie den LangChain-API-Schlüssel ein.
- Erstellen Sie Ihren ersten Posteingang: Öffnen Sie das Pop-up-Fenster "Einstellungen" (unten links in der Seitenleiste), klicken Sie auf "Posteingang hinzufügen" und geben Sie die entsprechenden Informationen ein.

Verwendungsprozess

Initiierung von Projekten::

   yarn start

Verbinden mit LangGraph Deployment::
- Fügen Sie den Namen des LangGraph-Graphen oder die Hilfskraft-ID hinzu.
- Geben Sie die URL des LangGraph-Einsatzes ein.
- Benennen Sie den Posteingang (optional).
Umgang mit Unterbrechungen::
- Aktualisieren Sie alle Instanzen im Code, die Interrupts verwenden, um mit Agent Inbox kompatibel zu sein.
- Definieren Sie Interrupt-Eingangs- und -Ausgangsmodi mit Python oder TypeScript.

Hauptfunktionen

Akzeptanz von UnterbrechungenActionRequest: Nimmt die Parameter oder Aktionen des Interrupts entgegen und sendet eine ActionRequest.
Bearbeiten UnterbrechenBearbeiten Sie die Parameter des Interrupts und senden Sie die geänderte ActionRequest.
Unterbrechungen ignorierenJe nach Konfiguration kann der Benutzer entscheiden, ob er Interrupts ignorieren möchte.
Reagieren auf Unterbrechungen: Der Benutzer kann je nach Art der Unterbrechung reagieren.

Detaillierte Vorgehensweise

Konfigurieren des Unterbrechungsmodus::
- Python-Interrupt-Modus: python class HumanInterrupt(BaseModel): action: str args: Dict[str, Any]
- TypeScript-Unterbrechungsmodus: typescript interface HumanInterrupt { action: string; args: Record<string, any>; }
Antwort senden::
- Je nach Art der Unterbrechung wird die entsprechende HumanResponse gesendet: python class HumanResponse(BaseModel): action_request: ActionRequest

Einführung in Umgebungsagenten

Die meisten aktuellen KI-Anwendungen folgen einem gängigen Chat-Modell (z. B. ChatGPT). Sie sind zwar einfach zu implementieren, verursachen aber unnötigen Interaktionsaufwand, schränken unsere Selbstskalierbarkeit ein und schöpfen das Potenzial des Large Language Model (LLM) nicht voll aus.

In den letzten sechs Monaten haben wir bei LangChain einen anderen Ansatz erprobt:Umweltbelastungen Reagieren auf Umgebungssignale und verlangen nur dann Benutzereingaben, wenn eine wichtige Gelegenheit erkannt wird oder ein Feedback erforderlich ist. Anstatt den Benutzer in ein neues Chat-Fenster zu zwingen, helfen diese Agenten Ihnen, sich auf das Wesentliche zu konzentrieren.

Wir haben die LangGraph um die Implementierung dieser Muster zu vereinfachen. Heute stellen wir unsere erste Referenzimplementierung vor: eineE-Mail-AssistentSie demonstriert die wichtigstenUmweltbelastungenMuster. In den nächsten Tagen werden wir weitere Beispiele und Tools veröffentlichen, mit denen Sie Ihre eigenen Umwelt-Workflows erstellen können.

Was ist ein Umweltwirkstoff?

Bei Verwendung des ChatGPT (oder jeder andere Chatbot), wenn sie sich darauf verlassen, dass Sie einen Dialog einleiten. Agenten werden von einem Menschen initiiert, der eine Nachricht sendet.

Dies ist für einige Anwendungsfälle großartig, hat aber für andere erhebliche Einschränkungen. Der Benutzer muss jedes Mal in die Chat-Schnittstelle gehen und eine Nachricht senden, damit der Agent seine Aufgabe erfüllen kann. Damit der Agent seine Arbeit aufnehmen kann, entsteht ein großer Aufwand.

Eine weitere Einschränkung besteht darin, dass man nur einen Dialog zur gleichen Zeit führen kann. Das macht es für uns Menschen schwierig, unsere Fähigkeiten zu erweitern - ein Agent kann immer nur eine Sache für uns tun.

Ein UX-Paradigma, das es uns ermöglicht, diese Einschränkungen zu überwinden, sollte zwei wesentliche Merkmale aufweisen:

Es sollte nicht (nur) durch menschliche Meldungen ausgelöst werden
Es sollte die gleichzeitige Ausführung mehrerer Agenten ermöglichen

Diese Merkmale definieren, was wir als Umweltbelastungen .

💡Umweltbelastungen den Ereignisstrom abhören und entsprechend handeln, möglicherweise bei mehreren Ereignissen gleichzeitig

Es sei darauf hingewiesen, dass wir nicht glauben, dassUmweltbelastungenmuss völlig autonom sein. In der Tat glauben wir, dass es sein wirdUmweltbelastungenEin wichtiger Teil des Vorstoßes in die Öffentlichkeit ist die Durchdachtheit der Wann? zu auf welche Weise Diese Mittel interagieren mit Menschen.

Mensch-Computer-Interaktion

Wir verwendenMensch-Computer-Interaktionum auf diese Mittel hinzuweisen Wann? zu auf welche Weise Interaktion mit Menschen. Darauf kommen wir später noch zu sprechen. auf welche Weise Aber jetzt lassen Sie uns diskutieren Wann? .

Wir sehen normalerweiseUmweltbelastungenDie drei gemeinsamenMensch-Computer-InteraktionModalitäten: Meldung, Fragen und Überprüfung.

Hinweis: Dem Benutzer mitteilen, dass ein Ereignis wichtig ist, aber keine Maßnahmen ergreifen. Dies ist nützlich, um Ereignisse zu markieren, die der Benutzer sehen sollte, aber der Agent hat keine Befugnis, darauf zu reagieren. Im Zusammenhang mit einem E-Mail-Assistenten könnte dies ein Agent sein, der ein Docusign in meinem Posteingang markiert - er kann dieses Docusign nicht unterschreiben, aber ich sollte wissen, dass es existiert.

Frage: Stellen Sie dem Benutzer eine Frage, um die Blockade des Agenten zu lösen. Es kann sein, dass der Agent versucht, etwas zu tun, aber nicht weiß, wie er es am besten tun soll, weil ihm einige wichtige Informationen fehlen. Anstatt zu halluzinieren oder zu raten, ist es besser, den Agenten den Menschen direkt fragen zu lassen, was er tun soll. Im Zusammenhang mit einem E-Mail-Assistenten könnte dies ein Agent sein, der mich fragt, ob ich an einer Besprechung teilnehmen möchte. Solange die Eingabeaufforderung keine Anweisungen an den Agenten über meine Sitzungspräferenzen enthält, kann er das unmöglich wissen. Ein menschlicher EA würde mich fragen, und das sollte ein Agent auch.

Rückblick: Überprüfen Sie die Aktionen, die der Agent durchführen möchte. Einige Aktionen sind so "gefährlich", dass es sich lohnen kann, für jede Aktion, die der Agent durchführen möchte, eine Überprüfung fest einzuplanen. Ein Mensch könnte die Aktion genehmigen, sie direkt bearbeiten oder dem Agenten direktes Feedback geben, wie er sie ändern kann. Im Zusammenhang mit einem E-Mail-Assistenten könnte dies eine ausgehende E-Mail sein. Er könnte einen Entwurf schreiben, aber ich muss ihn genehmigen, den Inhalt der Nachricht direkt bearbeiten oder dem Agenten sagen, dass er ihn irgendwie ändern soll.

Die Bedeutung der Interaktion zwischen Mensch und Computer

Wir glauben, dassMensch-Computer-InteraktionKomponenten fürUmweltbelastungenbringt drei wesentliche Vorteile:

Es verringert das Risiko und erleichtert den Agenten den Einstieg in die Produktion.
Sie ahmt die menschliche Kommunikation nach, um das Vertrauen der Nutzer zu stärken und ihre Akzeptanz zu erhöhen.
Es verbessert das Langzeitgedächtnis und das Lernen

HCI verringert das Risiko. Wenn ein Agent völlig autonom im Hintergrund läuft, kann er eigentlich keine Fehler machen. Man muss dem Agenten schon sehr viel Vertrauen entgegenbringen, wenn man ihn bestimmte Aktionen durchführen lässt (z. B. die Aktualisierung von Datenbanken, das Versenden von E-Mails an wichtige Kunden usw.). MitMensch-Computer-InteraktionSie können diese Vorgänge leicht kontrollieren und um eine ausdrückliche manuelle Genehmigung bitten. Auf diese Weise können Sie sicherstellen, dass Sie nicht die falschen E-Mails versenden.

HCI ahmt die Art und Weise nach, wie Menschen kommunizieren. Ein wichtiger Bestandteil der Zusammenarbeit mit anderen ist die Kommunikation mit ihnen. Wenn Sie zögern, stellen Sie ihnen Fragen und lassen Sie sie Ihnen helfen, Ideen zu prüfen. Wenn wir "Kollegen" haben, die Stellvertreter sind, schafft es Vertrauen bei den Nutzern, wenn sie auf ähnliche Weise kommunizieren, was die Akzeptanz fördert. Denken Sie an etwas wie Devin Etwa so. Sie wählen Benutzer mit Devin Eine der wichtigsten Schnittstellen für die Interaktion ist Slack. Dort interagieren wir mit menschlichen Entwicklern, warum sollten wir also nicht auch mit KI-Entwicklern auf diese Weise interagieren? Kommunikation ist wichtig.

Die Interaktion zwischen Mensch und Computer verbessert das Langzeitgedächtnis und das Lernen. Wir sind der festen Überzeugung, dass die Fähigkeit von KI-Agenten, zu lernen und sich im Laufe der Zeit immer besser auf menschliche Nutzer einzustellen, eine Schlüsselrolle spielt. Um diese Konsistenz zu erreichen, brauchen sie eine Form von Benutzer-Feedback. Diese Art vonMensch-Computer-InteraktionDie Komponente liefert dieses Feedback.

Proxy-Posteingang

Daher haben wir erörtert, dass die Agenten Wann? Kommunikation mit Menschen ( Benachrichtigungen(math.) Gattung Fragen stellen(math.) Gattung herauszensieren ), aber wir haben nicht darüber gesprochen, dass sie auf welche Weise Kommunikation.

auf ProbeUmweltbelastungenAls es um Slack ging, haben wir zunächst mit Slack begonnen. Der Hauptvorteil bestand darin, dass wir alle Slack bereits für unsere tägliche Arbeit nutzten, so dass es eine effektive Möglichkeit war, unsere Aufmerksamkeit zu erhalten und uns auf die Kommunikation mit unseren Mitarbeitern zu konzentrieren.

Der Nachteil von Slack ist, dass man leicht alle Benachrichtigungen verpassen kann. Wenn Sie auf einige Benachrichtigungen nicht reagieren, wächst der Rückstau an Slack-Benachrichtigungen. Auch die Kommunikation mit den Agenten ist eingeschränkt - man kann ihnen zwar Nachrichten schicken, aber alles andere ist schwieriger.

Wir haben uns an den so genannten "Proxy-Posteingang" gewandt. Dies ist dasselbe wieUmweltbelastungenInteraktive neue UX. Sie ist eine Kombination aus E-Mail-Posteingang und Kundensupport-Ticketing-System. Es zeigt alle offenen Kommunikationslinien zwischen Ihnen und dem Agenten an und macht es einfach, alle ausstehenden Aktionen zu verfolgen. Es handelt sich um eine eigenständige Benutzeroberfläche, die das Hinzufügen von Bedienfeldern, Schaltflächen oder anderen UI-Funktionen erleichtert, so dass Sie Benutzerfeedback leichter erfassen können. Derzeit sind die Elemente nur nach Zeit sortiert, aber in Zukunft werden Sie sie auch nach Priorität sortieren können. Zurzeit ist dieser Posteingang nur für einen Spieler, aber in Zukunft werden Sie sehen können, welche Aufgaben Ihnen und welche anderen Personen zugewiesen wurden.

Hinweis: Die Open-Source-Implementierung des Proxy-Posteingangs wird (bereits) am Donnerstag veröffentlicht.

Warum LangGraph ideal für Umweltbeauftragte ist

Bevor wir dieUmweltbelastungenWir stellen sicher, dass LangGraph diese Art von Agenten unterstützen kann. LangGraph-Plattform ) verfügt über einige wichtige Funktionen, die Sie vielleicht nicht selbst entwickeln möchten:

eingebautPersistenzschicht. LangGraph wird von einer Persistenzschicht unterstützt, die den Zustand des Agenten zwischen den einzelnen Operationen (oder Knoten des Graphen) festhält. Dadurch kann der Agent im Wesentlichen "pausieren" und auf das Feedback des Benutzers warten. Dies ist nützlich für die Ermöglichung vonMensch-Computer-InteraktionMuster sowie das Kurzzeitgedächtnis für Dialoge sind sehr wichtig.

eingebautUnterstützung der Mensch-Computer-Interaktion. Native Unterstützung von LangGraphMensch-Computer-InteraktionMuster. Die eingebaute Persistenzschicht ist ein wichtiger Teil davon, aber wir haben kürzlich auch die "Unterbrechungen". Dies ist eine neue integrierte Methode der Kommunikation mit den Endnutzern.

eingebautLangfristiges Gedächtnis. LangGraph verfügt über einen eingebauten Langzeitspeicher (im Wesentlichen ein Namespace Key-Value Store mit Unterstützung für semantische Suche). Dies ermöglicht es Agenten, dieMensch-Computer-InteraktionSein "Gedächtnis" lässt sich danach leicht aktualisieren.

Cron-Aufgaben. VieleUmweltbelastungenDie LangGraph-Plattform verfügt über einen eingebauten Cron-Task, der dies unterstützt.

Aufbau eines KI-E-Mail-Assistenten

Durch die Gestaltung unseres AlltagsUmweltbelastungenWir haben LangGraph sehr geeignet gemacht für die Konstruktion derUmweltbelastungenEine der wichtigsten ist ein E-Mail-Assistent. Einer der wichtigsten ist ein E-Mail-Assistent. Wenn Sie mich in den letzten sechs Monaten kontaktiert haben, ist die Wahrscheinlichkeit groß, dass der KI-Agent diese E-Mail verfasst hat (und wenn ich Sie übersehen habe, muss es die Schuld des KI-Agenten sein).

Heute stellen wir diesen E-Mail-Helfer vor, der sowohl ein kostenloser gehosteter E-Mail-Agent als auch ein Open-Source-Projekt ist. Wir möchten, dass gehostete E-Mail-Agenten einfach auszuprobieren und zu erleben sind!Umweltbelastungenund die Open-Source-Version kann als Referenzimplementierung dieses neuen Designparadigmas dienen.