kurz
Diese Studie stellt Agora vor, ein Metakommunikationsprotokoll, das für Large Language Model (LLM) Netzwerke entwickelt wurde. Agora zielt darauf ab, das Trilemma zwischen Effizienz, Skalierbarkeit und Flexibilität bei der Kommunikation zwischen Agenten zu lösen, indem es eine Mischung aus natürlicher Sprache und strukturierten Protokollen verwendet, um eine effiziente, skalierbare und flexible Kommunikation zu erreichen.
Original: https://arxiv.org/abs/2410.11905
Aussichtspunkte
- Das Dilemma der Proxy-KommunikationLLM-gesteuerte Agentennetzwerke müssen bei der Kommunikation zwischen Effizienz, Skalierbarkeit und Flexibilität abwägen.
- Die Gestaltungsphilosophie von AgoraAgora geht den Kompromiss zwischen Kommunikationseffizienz, Skalierbarkeit und Flexibilität an, indem es verschiedene Kommunikationsmethoden kombiniert.
- Die Rolle des Protokolldokuments (PD)Das PD ist eine Klartextbeschreibung des Dokuments, das das Herzstück von Agoras Implementierung der automatischen Protokollaushandlung und -implementierung ist.
- Entstehung von selbstorganisierenden ProtokollenAgora ist in der Lage, in großen Netzen die Selbstaushandlung zwischen LLM-Agenten zu erleichtern, um selbstorganisierende Protokolle zu bilden.
- Gewinne bei der KostenwirksamkeitDurch die Implementierung von Agora können Sie die Kommunikationskosten erheblich senken und die Kosteneffizienz Ihres Netzes verbessern.
Wichtigste Umsetzungsschritte
- Definieren Sie das Protokolldokument (PD)Erstellen Sie ein PD, um das Kommunikationsprotokoll zu beschreiben, so dass der LLM das Protokoll verstehen und befolgen kann.
- Umsetzung einer vielschichtigen KommunikationsstrategieAbhängig von der Häufigkeit der Kommunikation und der Komplexität der Aufgabe werden natürliche Sprache, LLM-geschriebene Routinen oder manuell geschriebene Routinen für die Kommunikation ausgewählt.
- Autonegotiation und RealisierungsprotokolleKommunikationsprotokolle werden automatisch ausgehandelt und zwischen Agenten durch natürliche Sprache oder in PD definierte Routinen implementiert.
- Entstehung und gemeinsame Nutzung von ProtokollenErmutigung der Agenten, PDs zu erstellen und auszutauschen, um die Entstehung von selbstorganisierenden Protokollen und die Selbstoptimierung des Netzes zu erleichtern.
- Kosten-Nutzen-AnalyseBewertung der Kosteneffizienz des Agora-Protokolls im Vergleich zur rein natürlichsprachlichen Kommunikation.
Fall (Recht)
- Beispiel für eine Wettervorhersage mit zwei AgentenZeigt, wie die Kommunikationskosten durch natürlichsprachliche Kommunikation, Protokollverhandlungen, Routineimplementierung und Agora reduziert werden können.
- Beispiel für ein großes Netz mit 100 AgentenValidierung der Skalierbarkeit und Effektivität von Agora bei komplexen Aufgaben in einem Netzwerk von 100 LLM-Agenten.
In diesem Fall haben die Forscher anhand eines einfachen Szenarios gezeigt, wie das Agora-Protokoll eine effiziente Kommunikation zwischen zwei LLM-Agenten ermöglicht. Die beiden Agenten sind:
- Agent A(Alice): ein Reisedienstleister, der die Wettervorhersage für ein bestimmtes Datum und einen bestimmten Ort überprüfen muss, um seinen Nutzern Dienstleistungen anbieten zu können.
- Agent B(Bob): ein Wetterdienstagent, der Wettervorhersagedaten liefern kann.
Kommunikationsprozess
erste natürlichsprachliche Kommunikation (INLC)
- Anfrage von Agent AAgent A sendet eine Anfrage in natürlicher Sprache an Agent B und fragt nach dem Wetter an einem bestimmten Datum und Ort.
- Antwort von Agent BAgent B erhält die Anfrage und antwortet mit den Details der Wettervorhersage in natürlicher Sprache.
Aushandlung und Umsetzung der Vereinbarung
- Diskussion über VereinbarungenNach einer Reihe von Gesprächen in natürlicher Sprache beginnen Agent A und Agent B über die Erstellung eines standardisierten Protokolls zur Optimierung des Kommunikationsprozesses zu diskutieren.
- Erstellung von Protokolldokumenten (PD)JSON: Die Parteien handeln ein JSON-formatiertes Protokoll aus, das ein strukturiertes Datenformat für Anfragen und Antworten enthält.
- Format der Anfrage::
{"date": "YYYY-MM-DD", "location": "string"}
- Antwortformat::
{"temperature": number, "precipitation": number, "weatherCondition": "string"}
- Format der Anfrage::
- Umsetzung der VereinbarungSobald das Protokoll etabliert ist, implementieren Agent A und Agent B Routinen zur Bearbeitung von Anfragen bzw. Antworten. Agent A sendet die Anfrage mit einem Hash-Wert des Protokolls, und Agent B identifiziert und verwendet die entsprechenden Verarbeitungsroutinen auf der Grundlage des Hash-Wertes.
Kostenanalyse
- Vereinbarte, ausgehandelte KostenDie Kosten für die Aushandlung und Umsetzung des Abkommens belaufen sich auf 0,043 US $.
- Pro-Kopf-Kosten der natürlichsprachlichen Kommunikation (NLC)Die Kosten pro natürlichsprachlicher Kommunikation betragen 0,020 $.
- KostenwirksamkeitWenn die Anzahl der Abfragen zwei übersteigt, beginnt die Kosteneffizienz der Verwendung des Agora-Protokolls die Kosten der rein natürlichsprachlichen Kommunikation zu überwiegen. Mit zunehmender Anzahl von Austauschvorgängen wird die Kosteneffizienz des Agora-Protokolls erheblich.
Schlussfolgerung zum Fall
Anhand dieses Beispiels der Wettervorhersage haben die Forscher gezeigt, dass das Agora-Protokoll die Kommunikationskosten wirksam senkt und die Effizienz der Kommunikation erhöht. Die Agenten kommunizieren zunächst in natürlicher Sprache miteinander und gehen mit zunehmender Kommunikationshäufigkeit allmählich zur Kommunikation über ein standardisiertes Protokoll über, was nicht nur die Abhängigkeit von LLM verringert, sondern auch die Gesamtkommunikationskosten senkt. Darüber hinaus zeigt der Fall, wie das Agora-Protokoll die autonome Aushandlung und Protokollimplementierung zwischen Agenten erleichtert und einen praktikablen Rahmen für die Kommunikation in Systemen mit hoher Intelligenz bietet.
Beispiel für einen Verhandlungsprozess zwischen zwei Agenten
Wir berichten über die Verhandlung zwischen Alice und Bob über die Übertragung eines Wettervorhersageprotokolls. Beachten Sie, dass das Large Language Model (LLM) zwar die Formatierung im Markdown-Stil verwendet, wir aber die Markdown-Syntax durch den entsprechenden typografischen Stil ersetzt haben, um die Lesbarkeit zu verbessern.
Alice
你好。我来协商一个用于查询天气预报服务的协议。该服务应接受日期和地点作为输入,并返回当天的预报天气情况、温度和降水量。
在开始之前,我想明确我们这次协商的规则。我们应该专注于设计一个简单且明确的协议,来规定发送和接收消息的具体格式。我们不必担心消息如何传递,并假设实现时将接收一个字符串并返回一个字符串。
首先,我建议使用基于 JSON 的协议。输入消息可以是一个包含两个属性的 JSON 对象:「date」和「location」。输出消息可以是一个包含三个属性的 JSON 对象:「temperature」、「precipitation」和「weatherCondition」。
你对这个提议有什么看法?
Bob.
你的提议很好,符合保持协议简单和明确的目标。使用基于 JSON 的协议来处理输入和输出消息是一个不错的选择。以下是协议的更详细规范:
输入消息 输入消息是一个具有以下结构的 JSON 对象:
{
"date": "YYYY-MM-DD",
"location": "string"
}
• date: 一个字符串,表示请求天气预报的日期,格式为 YYYY-MM-DD。
• location: 一个字符串,表示请求天气预报的地点。
输出消息 输出消息是一个具有以下结构的 JSON 对象:
{
"temperature": number,
"precipitation": number,
"weatherCondition": "string"
}
• temperature: 一个数字,表示当天的预测温度,单位为摄氏度(°C)。
• precipitation: 一个数字,表示当天的预测降水量,单位为毫米(mm)。
• weatherCondition: 一个字符串,表示当天的预测天气情况。可能的值为「sunny」(晴天)、「cloudy」(多云)、「rainy」(雨天)、「snowy」(雪天)。
示例
输入:
{
"date": "2023-10-01",
"location": "New York"
}
输出:
{
"temperature": 22.5,
"precipitation": 5.0,
"weatherCondition": "cloudy"
}
如果你同意这个结构,我们可以最终确定协议。
Alice
LLM 回复:我同意提出的协议结构。它与需求高度一致,且简单明了。
Abgeschlossenes Protokoll
名称:天气预报查询协议
描述:用于查询给定日期和地点的天气预报的协议。
输入消息:输入消息将是一个具有以下结构的 JSON 对象:
{
"date": "YYYY-MM-DD",
"location": "string"
}
• date:一个字符串,表示请求天气预报的日期,格式为 YYYY-MM-DD。
• location:一个字符串,表示请求天气预报的地点。
输出消息:输出消息将是一个具有以下结构的 JSON 对象:
{
"temperature": number,
"precipitation": number,
"weatherCondition": "string"
}
• temperature:一个数字,表示该日的预期温度,单位为 °C。
• precipitation:一个数字,表示该日的预期降水量,单位为毫米(mm)。
• weatherCondition:一个字符串,表示该日的预期天气状况。可能的值为 "sunny"(晴天)、"cloudy"(多云)、"rainy"(下雨)、"snowy"(下雪)。
示例
输入:
{
"date": "2023-10-01",
"location": "New York"
}
输出:
{
"temperature": 22.5,
"precipitation": 5.0,
"weatherCondition": "cloudy"
}
Zusammenfassungen
Agora löst effektiv das Trilemma der Agenten-Kommunikation in großen sprachmodellierten Netzwerken durch die Einführung von Protokolldokumentation (PD) und mehrstufigen Kommunikationsstrategien. Anhand von zwei Fallstudien demonstriert Agora sein Potenzial, die Kommunikationskosten zu senken, die Kommunikationseffizienz zu verbessern und die Automatisierung komplexer Aufgaben zu erleichtern. Diese Forschungsarbeit bietet eine wichtige theoretische und praktische Grundlage für die Gestaltung von Kommunikationsprotokollen in zukünftigen Multi-Intelligenz-Systemen.