kurz
EINLEITUNG Diese Studie stellt Agora vor, ein Metakommunikationsprotokoll, das für Large Language Model (LLM)-Netzwerke entwickelt wurde. Agora zielt darauf ab, das Trilemma zwischen Effizienz, Skalierbarkeit und Flexibilität bei der Kommunikation zwischen Agenten zu lösen, indem es eine Mischung aus natürlicher Sprache und strukturierten Protokollen verwendet, um eine effiziente, skalierbare und flexible...
Original: https://arxiv.org/abs/2410.11905
Aussichtspunkte
- Das Dilemma der Proxy-KommunikationLLM-gesteuerte Agentennetzwerke müssen bei der Kommunikation zwischen Effizienz, Skalierbarkeit und Flexibilität abwägen.
- Die Gestaltungsphilosophie von AgoraAgora geht den Kompromiss zwischen Kommunikationseffizienz, Skalierbarkeit und Flexibilität an, indem es verschiedene Kommunikationsmethoden kombiniert.
- Die Rolle des Protokolldokuments (PD)Das PD ist eine Klartextbeschreibung des Dokuments, das das Herzstück von Agoras Implementierung der automatischen Protokollaushandlung und -implementierung ist.
- Entstehung von selbstorganisierenden ProtokollenAgora ist in der Lage, in großen Netzen die Selbstaushandlung zwischen LLM-Agenten zu erleichtern, um selbstorganisierende Protokolle zu bilden.
- Gewinne bei der KostenwirksamkeitDurch die Implementierung von Agora können Sie die Kommunikationskosten erheblich senken und die Kosteneffizienz Ihres Netzes verbessern.
Wichtigste Umsetzungsschritte
- Definieren Sie das Protokolldokument (PD)Erstellen Sie ein PD, um das Kommunikationsprotokoll zu beschreiben, so dass der LLM das Protokoll verstehen und befolgen kann.
- Umsetzung einer vielschichtigen KommunikationsstrategieAbhängig von der Häufigkeit der Kommunikation und der Komplexität der Aufgabe werden natürliche Sprache, LLM-geschriebene Routinen oder manuell geschriebene Routinen für die Kommunikation ausgewählt.
- Autonegotiation und RealisierungsprotokolleKommunikationsprotokolle werden automatisch ausgehandelt und zwischen Agenten durch natürliche Sprache oder in PD definierte Routinen implementiert.
- Entstehung und gemeinsame Nutzung von ProtokollenErmutigung der Agenten, PDs zu erstellen und auszutauschen, um die Entstehung von selbstorganisierenden Protokollen und die Selbstoptimierung des Netzes zu erleichtern.
- Kosten-Nutzen-AnalyseBewertung der Kosteneffizienz des Agora-Protokolls im Vergleich zur rein natürlichsprachlichen Kommunikation.
Fall (Recht)
- Beispiel für eine Wettervorhersage mit zwei AgentenZeigt, wie die Kommunikationskosten durch natürlichsprachliche Kommunikation, Protokollverhandlungen, Routineimplementierung und Agora reduziert werden können.
- Beispiel für ein großes Netz mit 100 AgentenValidierung der Skalierbarkeit und Effektivität von Agora bei komplexen Aufgaben in einem Netzwerk von 100 LLM-Agenten.
In diesem Fall haben die Forscher anhand eines einfachen Szenarios gezeigt, wie das Agora-Protokoll eine effiziente Kommunikation zwischen zwei LLM-Agenten ermöglicht. Die beiden Agenten sind:
- Agent A(Alice): ein Reisedienstleister, der die Wettervorhersage für ein bestimmtes Datum und einen bestimmten Ort überprüfen muss, um seinen Nutzern Dienstleistungen anbieten zu können.
- Agent B(Bob): ein Wetterdienstagent, der Wettervorhersagedaten liefern kann.
Kommunikationsprozess
erste natürlichsprachliche Kommunikation (INLC)
- Anfrage von Agent AAgent A sendet eine Anfrage in natürlicher Sprache an Agent B und fragt nach dem Wetter an einem bestimmten Datum und Ort.
- Antwort von Agent BAgent B erhält die Anfrage und antwortet mit den Details der Wettervorhersage in natürlicher Sprache.
Aushandlung und Umsetzung der Vereinbarung
- Diskussion über VereinbarungenNach einer Reihe von Gesprächen in natürlicher Sprache begannen Agent A und Agent B über die Erstellung eines standardisierten Protokolls zu diskutieren, um den Kommunikationsprozess zu optimieren.
- Erstellung von Protokolldokumenten (PD)JSON: Die Parteien handeln ein JSON-formatiertes Protokoll aus, das ein strukturiertes Datenformat für Anfragen und Antworten enthält.
- Format der Anfrage::
{"Datum": "JJJJ-MM-TT", "Ort": "string"}
- Antwortformat::
{"Temperatur": Zahl, "Niederschlag": Zahl, "weatherCondition": "string"}
- Format der Anfrage::
- Umsetzung der VereinbarungSobald das Protokoll eingerichtet ist, implementieren Agent A und Agent B Routinen zur Bearbeitung von Anfragen bzw. Antworten. Agent A sendet die Anfrage mit einem Hash-Wert des Protokolls, und Agent B identifiziert und verwendet die entsprechenden Verarbeitungsroutinen auf der Grundlage des Hash-Wertes.
Kostenanalyse
- Vereinbarte, ausgehandelte KostenDie Kosten für die Aushandlung und Umsetzung des Abkommens belaufen sich auf 0,043 US $.
- Pro-Kopf-Kosten der natürlichsprachlichen Kommunikation (NLC)Die Kosten pro natürlichsprachlicher Kommunikation betragen 0,020 $.
- KostenwirksamkeitWenn die Anzahl der Abfragen zwei übersteigt, beginnt die Kosteneffizienz der Verwendung des Agora-Protokolls die Kosten der rein natürlichsprachlichen Kommunikation zu überwiegen. Mit zunehmender Anzahl von Austauschvorgängen wird die Kosteneffizienz des Agora-Protokolls erheblich.
Schlussfolgerung zum Fall
Anhand dieses Beispiels der Wettervorhersage haben die Forscher gezeigt, dass das Agora-Protokoll die Kommunikationskosten wirksam senkt und die Effizienz der Kommunikation erhöht. Die Agenten kommunizieren zunächst in natürlicher Sprache miteinander und gehen mit zunehmender Kommunikationshäufigkeit allmählich zur Kommunikation über ein standardisiertes Protokoll über, was nicht nur die Abhängigkeit von LLM verringert, sondern auch die Gesamtkommunikationskosten senkt. Darüber hinaus zeigt der Fall, wie das Agora-Protokoll die autonome Verhandlung und Protokollimplementierung zwischen Agenten erleichtert und einen praktikablen Rahmen für die Kommunikation in Systemen mit mehreren Intelligenzen bietet.
Beispiel für einen Verhandlungsprozess zwischen zwei Agenten
Wir berichten über die Verhandlung zwischen Alice und Bob über die Übertragung eines Wettervorhersageprotokolls. Beachten Sie, dass das Large Language Model (LLM) zwar die Formatierung im Markdown-Stil verwendet, wir aber die Markdown-Syntax durch den entsprechenden typografischen Stil ersetzt haben, um die Lesbarkeit zu verbessern.
Alice
Hallo. Ich bin hier, um eine Vereinbarung für einen Wetterabfragedienst auszuhandeln. Ich bin hier, um ein Protokoll für einen Dienst auszuhandeln, der Wettervorhersagen abfragt. Der Dienst soll Datum und Ort als Eingaben akzeptieren und die vorhergesagten Wetterbedingungen, Temperatur und Niederschlag für den Tag zurückgeben.
Bevor wir beginnen, möchte ich unsere Regeln für diese Verhandlung klären. Wir sollten uns darauf konzentrieren, ein einfaches und klares Protokoll zu entwerfen, das das genaue Format für das Senden und Empfangen von Nachrichten festlegt. Wir müssen uns keine Gedanken darüber machen, wie die Nachrichten zugestellt werden, und davon ausgehen, dass die Implementierung eine Zeichenkette empfängt und eine Zeichenkette zurückgibt.
Für den Anfang empfehle ich die Verwendung eines Protokolls, das auf dem JSON des Protokolls. Die Eingabenachricht kann eine Eigenschaft sein, die zwei JSON Objekt: "DieDatum" und "Standort". Die Ausgabemeldung kann ein Attribut sein, das drei JSON Objekte: "Temperatur", "Niederschlag" und "weatherCondition".
Was halten Sie von diesem Vorschlag?
Bob.
Ihr Vorschlag ist gut und entspricht dem Ziel, das Protokoll einfach und klar zu halten. Die Verwendung eines Protokolls, das auf JSON Das Protokoll für die Behandlung von Ein- und Ausgabemeldungen ist eine gute Wahl. Hier ist eine detailliertere Spezifikation des Protokolls:
Eingabenachrichten Eine Eingabenachricht ist eine Struktur mit einer JSON Objekt:
{
"Datum": "JJJJ-MM-TT",
"Standort": "string"
}
- date: eine Zeichenfolge, die das Datum der Wettervorhersageanforderung im Format JJJJ-MM-TT angibt.
- location: eine Zeichenfolge, die den Ort der angeforderten Wettervorhersage angibt.
Ausgabemeldung Die Ausgabemeldung ist eine JSON Objekt:
{
"Temperatur": Nummer,
"Niederschlag": Nummer,
"WetterBedingung": "string"
}
- Temperatur: eine Zahl, die die vorhergesagte Temperatur für den Tag in Grad Celsius (°C) angibt.
- precipitation: eine Zahl, die den vorhergesagten Niederschlag für den Tag in Millimetern (mm) angibt.
- weatherCondition: eine Zeichenfolge, die die vorhergesagte Wetterlage für den Tag angibt. Mögliche Werte sind "sonnig", "bewölkt", "regnerisch", "verschneit".
Beispiel
Eingabe:
{
"Datum": "2023-10-01",
"Standort": "New York"
}
Ausgabe:
{
"Temperatur": 22.5,
"Niederschlag": 5.0,
"WetterBedingung": "wolkig"
}
Wenn Sie mit dieser Struktur einverstanden sind, können wir die Vereinbarung abschließen.
Alice
LLM ANTWORT: Ich bin mit der vorgeschlagenen Protokollstruktur einverstanden. Sie steht in hohem Maße im Einklang mit den Anforderungen und ist einfach und geradlinig.
Abgeschlossenes Protokoll
Name: Protokoll zur Abfrage der Wettervorhersage
BESCHREIBUNG: Protokoll zur Abfrage der Wettervorhersage für ein bestimmtes Datum und einen bestimmten Ort.
Eingabenachricht: Die Eingabenachricht ist eine Struktur mit einer JSON Objekt:
{
"Datum": "JJJJ-MM-TT",
"Standort": "string"
}
- date: eine Zeichenfolge, die das Datum der Wettervorhersageanforderung im Format JJJJ-MM-TT angibt.
- Ort: eine Zeichenfolge, die den Ort der angeforderten Wettervorhersage angibt.
Ausgabemeldung: Die Ausgabemeldung ist eine JSON Objekt:
{
"Temperatur": Nummer,
"Niederschlag": Nummer,
"WetterBedingung": "string"
}
- Temperatur: eine Zahl, die die erwartete Temperatur in °C für den Tag angibt.
- precipitation: eine Zahl, die die für den Tag erwartete Niederschlagsmenge in Millimetern (mm) angibt.
- weatherCondition: eine Zeichenfolge, die die erwartete Wetterlage für den Tag angibt. Mögliche Werte sind "sonnig"(Sunny),"wolkig"(bewölkt),"Regnerisch."(ES REGNET)"verschneit"(schneit).
Beispiel
Eingabe:
{
"Datum": "2023-10-01",
"Standort": "New York"
}
Ausgabe:
{
"Temperatur": 22.5,
"Niederschlag": 5.0,
"WetterBedingung": "wolkig"
}
Zusammenfassungen
Agora löst effektiv das Trilemma der Agenten-Kommunikation in großen sprachmodellierten Netzwerken durch die Einführung von Protokolldokumentation (PD) und mehrstufigen Kommunikationsstrategien. Anhand von zwei Fallstudien demonstriert Agora sein Potenzial, die Kommunikationskosten zu senken, die Kommunikationseffizienz zu verbessern und die Automatisierung komplexer Aufgaben zu erleichtern. Diese Forschungsarbeit bietet eine wichtige theoretische und praktische Grundlage für die Gestaltung von Kommunikationsprotokollen in zukünftigen Multi-Intelligenz-Systemen.