seit OpenAI
Einführung von Funktionsaufrufen im Jahr 2023 (Function Calling
), seit die Industrie darüber nachdenkt, wie man eine florierende KI-Intelligenz aufbauen kann (Agent
) und Ökosysteme für die Werkzeugnutzung. Da die zugrunde liegenden Modelle immer robuster werden, werden die Intelligenzen mit externen Tools, Daten und API
Die Fähigkeit zur Interaktion wird jedoch zunehmend fragmentiert. Die Entwickler müssen für jedes System, auf dem die Intelligenzen laufen und in das sie integriert sind, eine spezielle Geschäftslogik implementieren.
Es liegt auf der Hand, dass eine Standardschnittstelle für die Ausführung, die Datenerfassung und den Werkzeugaufruf erforderlich ist.API
war der erste große Vereinheitlicher des Internets, der eine gemeinsame Sprache für die Softwarekommunikation schuf, aber KI-Modelle haben keine Analogien.
Das Modellkontextprotokoll (Model Context Protocol
, MCP
), das im November 2024 auf den Markt kommt, hat unter Entwicklern und der KI-Gemeinschaft als potenzielle Lösung große Aufmerksamkeit erregt. In diesem Papier untersuchen wir MCP
Was es ist, wie es die Art und Weise verändert, wie KI mit Werkzeugen interagiert, was Entwickler bereits damit entwickelt haben und welche Herausforderungen noch zu bewältigen sind.
Was ist MCP?
MCP
ist ein offenes Protokoll, das es Systemen ermöglicht, KI-Modellen auf eine Art und Weise Kontext zu liefern, die für alle Integrationen gleich ist. Das Protokoll definiert, wie KI-Modelle externe Tools aufrufen, Daten erfassen und mit Diensten interagieren. Als konkretes Beispiel zeigt das folgende Diagramm Resend
MCP
Wie funktioniert der Server mit mehreren MCP
Zusammenarbeit mit Kunden.
Die Idee ist nicht neu;MCP
Aus dem Sprachserverprotokoll (Language Server Protocol
, LSP
) ließ sich von der Unter LSP
In diesem Fall fragt der Client bei der Eingabe im Editor den Sprachserver nach Vorschlägen zur automatischen Vervollständigung oder nach Diagnoseinformationen ab.LSP
Der Erfolg besteht darin, dass die Implementierung von Sprachfunktionen (z. B. Autovervollständigung, Fehlerprüfung) von den Editoren selbst entkoppelt wird, so dass ein Sprachserver mehrere Editoren bedienen kann, was die Entwicklungseffizienz und die Dynamik des Ökosystems erheblich verbessert.
MCP
verglichen mit LSP
Die Erweiterung dessen liegt in seinem intelligenten, körperzentrierten Ausführungsmodell.LSP
In erster Linie reaktiv (Reaktion auf Benutzereingaben vom IDE
Anfrage), und die MCP
sind darauf ausgelegt, autonome KI-Workflows zu unterstützen. KI-Intelligenzen können auf der Grundlage des Kontexts entscheiden, welche Werkzeuge in welcher Reihenfolge zu verwenden sind und wie sie miteinander verknüpft werden können, um Aufgaben zu erledigen. Dies ist ein wichtiger Unterschied:LSP
Unterstützung von menschlichen Entwicklern und die MCP
Entwickelt, um KI-Intelligenzen ein autonomeres Handeln zu ermöglichen.MCP
Außerdem wird der "Man-in-the-Loop" eingeführt (human-in-the-loop
) die Möglichkeit, dass Menschen zusätzliche Daten bereitstellen und die Ausführung genehmigen, wodurch die Kontrollierbarkeit erhöht wird.
Derzeit beliebte Anwendungsfälle
Durch das Konfigurieren der entsprechenden MCP
Server, kann der Benutzer jede MCP
Der Client wird in eine "Universalanwendung" umgewandelt (everything app
).
laut Cursor
Ein Beispiel: Obwohl Cursor
ist ein Code-Editor, aber es ist auch ein gut implementiertes MCP
Client. Endbenutzer können den Slack
MCP
Der Server verwandelt sie in Slack
Client, unter Verwendung des Resend
MCP
Server, um E-Mails zu versenden, sowie die Verwendung des Replicate
MCP
Server, um Bilder zu erzeugen. Ein leistungsfähigerer Weg, neue Prozesse freizuschalten, ist die Installation mehrerer Server auf einem einzigen Client: Ein Benutzer kann einen Server installieren, um Bilder vom Cursor
Generierung des Frontends UI
Die intelligente Stelle ist auch erforderlich, um die Bilderzeugung zu nutzen MCP
Der Server erzeugt das Hauptbild für die Website.
abgesehen von Cursor
Die meisten aktuellen Anwendungsfälle lassen sich als entwicklerzentriert, lokal-zuerst (local-first
), oder die Verwendung großer Sprachmodelle (LLM
), um ein neues Erlebnis zu schaffen (net-new experiences
).
Auf Entwickler ausgerichtete Arbeitsabläufe
Ein häufiges Gefühl von Entwicklern, die jeden Tag mit Code zu tun haben, ist: "Ich möchte meinen Arbeitsplatz nicht verlassen. IDE
Tun Sie etwas."MCP
Server sind eine gute Möglichkeit, diesen Traum zu verwirklichen.
Entwickler können jetzt die Postgres
MCP
Der Server führt nur Lesezugriffe durch SQL
Befehl, verwenden Sie den Upstash
MCP
Der Server befindet sich direkt im IDE
um zwischengespeicherte Indizes zu erstellen und zu verwalten, ohne zum Supabase
oder andere Werkzeuge. Bei der Iteration von Code können die Entwickler auch die Browsertools
MCP
Zugang zu Echtzeit-Umgebungen für Feedback und Debugging für kodierende Intelligenzen.
Zusätzlich zu den Arbeitsabläufen, die mit den Entwicklungswerkzeugen interagieren, werden dieMCP
Eine der neueren Anwendungen der Serverfreischaltung ist die Automatisierung des Prozesses der Servergenerierung durch Crawlen einer Webseite oder eines dokumentenbasierten MCP
Server, um hochpräzisen Kontext zu kodierenden Intelligenzen hinzuzufügen. Die Entwickler können den Kontext direkt aus der vorhandenen Dokumentation erstellen oder API
aktivieren (einen Plan) MCP
Server, wodurch die Tools sofort für KI-Intelligenzen zugänglich sind, ohne dass manuelle Integrationen erforderlich sind. Das bedeutet, dass weniger Zeit für Beispielcode aufgewendet werden muss und mehr Zeit für die tatsächliche Nutzung des Tools zur Verfügung steht - sei es für die Einführung von Echtzeitkontext, die Ausführung von Befehlen oder die sofortige Erweiterung der Fähigkeiten des KI-Assistenten.
Eine ganz neue Erfahrung
(tun Sie es einfach) ohne zu zögern IDE
als ob Cursor
Grund MCP
erhalten die meiste Aufmerksamkeit, weil sie für technische Benutzer sehr attraktiv sind, aber sie sind nicht die einzigen verfügbaren MCP
Kunde. Für nicht-technische Benutzer ist derClaude Desktop
ist ein hervorragender Einstiegspunkt, um MCP
Getriebene Werkzeuge sind für die Allgemeinheit leichter zugänglich und nutzbar. Erwarten Sie, dass es bald spezielle Tools für geschäftsorientierte Aufgaben wie Kundensupport, Marketingtexte, Design und Bildbearbeitung geben wird! MCP
Die Kunden tauchen auf, weil diese Bereiche eng mit den Stärken der KI bei der Mustererkennung und bei kreativen Aufgaben verbunden sind.
MCP
Das Design des Clients und die spezifischen Interaktionen, die er unterstützt, spielen eine Schlüsselrolle bei seinen Fähigkeiten. So wird eine Chat-Anwendung wohl kaum eine vektoriell gerenderte Leinwand enthalten, ebenso wenig wie ein Design-Tool die Möglichkeit bieten wird, Code auf einem entfernten Rechner auszuführen. Letztlich ist dieMCP
Das Kundenerlebnis definiert die gesamte MCP
Benutzererfahrung-Und in der MCP
In Bezug auf die Kundenerfahrung gibt es noch sehr viel Raum für Entdeckungen.
Highlight
Wie realisiert man @
Befehl zum Aufrufen beliebiger MCP
Der Server ist ein Beispiel dafür. Das Ergebnis ist eine neue UX
Modell.MCP
Der Kunde kann die generierten Inhalte an eine beliebige nachgelagerte Anwendung seiner Wahl übertragen.
Ein weiteres Beispiel ist Blender
MCP
Server-Anwendungsfälle: jetzt, kaum verstanden Blender
von Amateurnutzern können die Modelle, die sie erstellen wollen, in natürlicher Sprache beschreiben. Mit der Unterstützung der Gemeinschaft für Unity
im Gesang antworten Unreal
und anderen Tools wie Serverimplementierungen werden Text-zu-3D-Workflows in Echtzeit bereitgestellt. Dies ist ein gutes Omen für MCP
Potenzial, die Hürde für die Nutzung von Spezialsoftware deutlich zu senken.
MCP-Ökosystem-Karte
Obwohl wir uns in erster Linie mit Servern und Clients befassen, werden mit der Weiterentwicklung von Protokollen auch dieMCP
Das Ökosystem nimmt Gestalt an. Diese Marktkarte deckt die derzeit dynamischsten Bereiche ab, obwohl es noch viele Lücken gibt. Angesichts der MCP
Der Markt steckt noch in den Kinderschuhen, aber es ist zu erwarten, dass mit zunehmender Entwicklung und Reifung des Marktes weitere Akteure hinzukommen werden.
existieren MCP
Auf der Kundenseite.Die meisten hochqualitativen Kunden, die man heute sieht, sind kodierungsorientiert. Das ist nicht überraschend, denn Entwickler sind in der Regel die ersten, die neue Technologien übernehmen. Mit der Reifung des Protokolls werden jedoch auch mehr geschäftsorientierte Kunden zu erwarten sein.
Das meiste, was Sie sehen MCP
Server sind lokal ausgerichtet und konzentrieren sich auf Einzelbenutzerszenarien. Dies ist MCP
Derzeit basiert die Hauptunterstützung auf dem Senden von Ereignissen durch den Server (SSE
) und die Verkörperung von Befehlsverbindungen. Da Ökosysteme jedoch die Fernsteuerung MCP
Ein Bürger erster Klasse werden und MCP
Annahme von fließfähigen HTTP
Übertragung (Streamable HTTP transport
), ist zu erwarten, dass MCP
Der Einsatz von Servern wird zunehmen.
Inzwischen ist eine neue Welle von MCP
Märkte (marketplace
) und eine Welle von Server-Hosting-Lösungen entstehen, die es ermöglichen MCP
Server-Erkennung. Wie die Mintlify
(in Form eines Nominalausdrucks) mcpt
undSmithery
im Gesang antworten OpenTools
Ein solcher Marktplatz macht es Entwicklern leichter, neue Produkte zu entdecken, auszutauschen und beizusteuern. MCP
Server - sehr ähnlich npm
Wie sie sich verändert hat JavaScript
der Paketverwaltung, oder RapidAPI
Wie sie erweitert wurde API
Entdeckung. Diese Ebene ist wichtig für die Standardisierung von hoher Qualität MCP
Der Serverzugriff ist entscheidend, damit KI-Intelligenzen bei Bedarf dynamisch Tools auswählen und integrieren können.
im Zuge von MCP
Zunahme der Akzeptanz.Infrastruktur und Instrumente werden eine Schlüsselrolle dabei spielen, Ökosysteme skalierbarer, zuverlässiger und zugänglicher zu machen. Wie Mintlify
undStainless
im Gesang antworten Speakeasy
Solche Server-Generierungs-Tools verringern die Notwendigkeit der Erstellung von MCP
Reibung von kompatiblen Diensten, während Dienste wie Cloudflare
im Gesang antworten Smithery
Solche gehosteten Lösungen bewältigen die Herausforderungen der Bereitstellung und Skalierung. In der Zwischenzeit werden gehostete Lösungen wie Toolbase
Eine solche Plattform für das Verbindungsmanagement vereinfacht die lokale Prioritätensetzung MCP
Schlüsselverwaltung und Bevollmächtigte.
Künftige Möglichkeiten und Herausforderungen
Wir stehen jedoch erst am Anfang der Entwicklung von nativen Architekturen für Intelligenzen. Obwohl das heutige Verständnis von MCP
Leidenschaftlich, aber nicht im Sinne von MCP
Bei der Entwicklung und Freigabe von Produkten gibt es noch viele ungelöste Probleme. Das Ausmaß, in dem diese Herausforderungen gelöst werden, wird sich direkt auswirken auf MCP
Kann es ein echter Industriestandard werden?
Zu den wichtigsten Themen, die in der nächsten Phase des Abkommens behandelt werden sollen, gehören:
Hosting und Mehrmandantenfähigkeit (Multi-Tenancy)
MCP
Eins-zu-viele-Beziehungen zwischen KI-Intelligenzen und ihren Werkzeugen werden unterstützt, aber mehrmandantenfähige Architekturen (z. B. SaaS
Produkte) müssen viele Benutzer unterstützen, die gleichzeitig auf gemeinsame MCP
Server. Die Standardunterstützung für entfernte Server kann darin bestehen, dass MCP
Server sind als kurzfristige Lösung leichter zugänglich, aber viele Unternehmen wollen auch ihre eigenen Server hosten. MCP
Server und die Trennung von Daten- und Steuerungsebene.
Unterstützung für groß angelegte MCP
Eine vereinfachte Toolchain für die Serverbereitstellung und -wartung ist der nächste Schritt, um eine breitere Akzeptanz zu erreichen.
Authentifizierung
MCP
Es gibt keinen Standardmechanismus, um zu definieren, wie sich ein Client bei einem Server authentifiziert, und es gibt auch keinen MCP
Der Server stellt gerade eine Verbindung zu einem Drittanbieter her API
Ein Rahmen dafür, wie die Authentifizierung bei Interaktionen sicher verwaltet und delegiert werden sollte. Die Authentifizierung liegt derzeit im Ermessen der einzelnen Implementierungen und Einsatzszenarien. In der Praxis.MCP
Bisher scheint sich die Akzeptanz auf die lokale Integration zu konzentrieren, also auf Szenarien, in denen eine ausdrückliche Authentifizierung nicht immer erforderlich ist.
Ein besseres Paradigma für die Authentifizierung könnte die Fernauthentifizierung sein MCP
Ein wichtiger Durchbruch bei der Einführung. Aus der Sicht eines Entwicklers sollte ein einheitlicher Ansatz Folgendes umfassen:
- Client-Authentifizierung: als ob
OAuth
vielleichtAPI
Für die Interaktion zwischen Client und Server werden Standardmethoden wie Token verwendet. - Werkzeug-Zertifizierung: Für die Bereitstellung von Drittparteien
API
Eine Hilfsfunktion oder ein Wrapper, der die Authentifizierung durchführt. - Multi-User-Authentifizierung: Mieterspezifische Authentifizierung für Unternehmensbereitstellungen.
Das Fehlen einer standardisierten Akkreditierung ist derzeit ein Hindernis MCP
In einem größeren und sichereren SaaS
Eines der Haupthindernisse für die Anwendung in der Umwelt.
Autorisierung
Selbst wenn das Tool die Authentifizierung besteht, wer sollte es nutzen dürfen? Wie detailliert sollten die Berechtigungen sein?MCP
Es fehlt ein eingebautes Berechtigungsmodell, so dass die Zugangskontrolle auf der Ebene der Sitzung erfolgt - was bedeutet, dass ein Werkzeug entweder zugänglich ist oder vollständig eingeschränkt wird. Künftige Autorisierungsmechanismen können zwar feiner abgestufte Kontrollen vorsehen, aber der derzeitige Ansatz beruht auf der Verwendung eines OAuth 2.1
des Autorisierungsprozesses und gewährt nach erfolgter Authentifizierung einen sitzungsweiten Zugriff. Dies kann die Komplexität erhöhen, wenn mehr Intelligenzen und Tools eingeführt werden - jede Intelligenz erfordert in der Regel eine eigene Sitzung und eindeutige Autorisierungsdaten, was zu einem immer größeren sitzungsbasierten Zugangsverwaltungsnetz führt.
Eine fein abgestufte Autorisierung ist entscheidend für Unternehmensanwendungen und Szenarien, die eine strenge Kontrolle der Berechtigungen erfordern.
Gateway
im Zuge von MCP
Durch die Skalierung kann das Gateway als zentrale Ebene für Authentifizierung, Autorisierung, Verkehrsmanagement und Toolauswahl fungieren. Ähnlich wie bei API
Gateway, das die Zugangskontrolle durchsetzt und Anfragen an die richtigen Stellen weiterleitet MCP
Server, Lastausgleich und Zwischenspeicherung von Antworten für mehr Effizienz. Dies ist besonders wichtig für mandantenfähige Umgebungen, in denen unterschiedliche Nutzer und Intelligenzen unterschiedliche Berechtigungen benötigen. Ein standardisiertes Gateway wird die Interaktion zwischen Client und Server vereinfachen, die Sicherheit verbessern und eine bessere Beobachtbarkeit ermöglichen, so dass die MCP
Die Bereitstellung ist besser skalierbar und verwaltbar.
Erkennbarkeit und Verfügbarkeit von MCP-Servern
Gegenwärtig ist das Finden und Einstellen MCP
Server sind ein manueller Prozess, bei dem Entwickler Endpunkte oder Skripte finden, die Authentifizierung konfigurieren und die Kompatibilität zwischen Servern und Clients sicherstellen müssen. Die Integration neuer Server ist zeitaufwändig, und KI-Intelligenzen können verfügbare Server nicht dynamisch erkennen oder sich an sie anpassen.
Nach Angaben von Anthropic
der letzten Monat auf der AI Engineers Conference sprach.Es scheint, dass ein MCP
Server-Registrierung und Erkennungsprotokolle in Kürze. Dies kann die Grundlage bilden für MCP
Mit der Einführung von Servern wird die nächste Stufe erschlossen. Standardisierte Erkennungsmechanismen sind von entscheidender Bedeutung für die Verwirklichung der Vision einer autonomen Werkzeugauswahl durch intelligente Menschen.
Ausführungsumgebung
Bei den meisten KI-Workflows müssen mehrere Tools nacheinander aufgerufen werden - aber die MCP
Fehlen von integrierten Workflow-Konzepten zur Verwaltung dieser Schritte. Erfordernis für jeden Kunden, die Wiederherstellbarkeit zu implementieren (resumability
) und Wiederholbarkeit (retryability
) ist nicht ideal. Obwohl die Entwickler heute die folgenden Möglichkeiten erforschen Inngest
Eine solche Lösung des Problems würde jedoch eine zustandsabhängige Ausführung (stateful execution
) Durch die Erhebung zu einem erstklassigen Konzept wird das Ausführungsmodell für die meisten Entwickler klarer.
Standard-Kundenerfahrung
Eine häufige Frage in der Entwicklergemeinschaft ist, wie man die MCP
Berücksichtigen Sie die Tool-Auswahl auf der Client-Seite: Muss jeder seine eigene Sucherweiterungserzeugung für das Tool implementieren (RAG
) System, oder gibt es eine Schicht, die darauf wartet, standardisiert zu werden?
Neben der Werkzeugauswahl gibt es auch keine Einheitlichkeit für das aufrufende Werkzeug UI/UX
Modi (alles von Schrägstrich-Befehlen bis hin zu einfacher natürlicher Sprache). Eine standardmäßige clientseitige Schicht für die Erkennung, Abfolge und Ausführung von Werkzeugen, die zu einer besseren Vorhersehbarkeit für Entwickler und Benutzer beiträgt.
Komponenten während der Prüfung anpassen
MCP
Die Entwickler von Servern stellen oft fest, dass sie mit denselben MCP
Für Server ist es schwierig, problemlos auf verschiedenen Clients zu arbeiten. Normalerweise muss jeder MCP
Clients haben ihre eigenen Macken, und clientseitige Spuren sind entweder nicht vorhanden oder schwer zu finden, so dass die Fehlersuche MCP
Server extrem schwierig. Da die Welt beginnt, mehr Remote-First MCP
Servern wurde ein neuer Satz von Tools benötigt, um die Entwicklung sowohl in lokalen als auch in entfernten Umgebungen zu vereinfachen.
Die weitreichenden Auswirkungen der KI-Instrumentierung
MCP
Die Entwicklungserfahrung erinnert an die 2010er Jahre API
Entwicklung. Das Paradigma ist neu und aufregend, aber die Toolchain ist noch sehr jung. Wenn man ein paar Jahre vorspult, wird dieMCP
Was passiert, wenn Sie der De-facto-Standard für KI-gesteuerte Workflows werden? Einige Vorhersagen:
- Wettbewerbsvorteil von "Dev-First"-Unternehmen wird sich weiterentwickeln: Von der Bereitstellung der besten
API
Design, das auch die beste Sammlung von Werkzeugen für die Nutzung durch die Intelligenz bietet. Wenn dieMCP
mit der Fähigkeit, selbständig Werkzeuge zu entdecken.API
im Gesang antwortenSDK
Die Anbieter müssen dafür sorgen, dass ihre Werkzeuge durch die Suche leicht auffindbar und differenziert genug sind, damit Intelligenzen sie für bestimmte Aufgaben auswählen können. Dies kann auf einer feineren und spezifischeren Granularitätsebene geschehen, als sie menschliche Entwickler suchen. - Neue Preismodelle könnten entstehenWenn jede Bewerbung zum
MCP
Kunde, jederAPI
geworden sindMCP
Server kann die Intelligenz die Werkzeuge dynamischer auf der Grundlage einer Kombination aus Geschwindigkeit, Kosten und Relevanz auswählen. Dies kann zu einem stärker marktgesteuerten Prozess der Werkzeugübernahme führen, bei dem die leistungsfähigsten und modularsten Werkzeuge ausgewählt werden und nicht die am weitesten verbreiteten. - Die Dokumentation wird
MCP
Schlüsselkomponenten der InfrastrukturDas Unternehmen muss in einem klaren, maschinenlesbaren Format vorliegen (z. B.llms.txt
) Entwurfswerkzeuge undAPI
und machenMCP
Der Server wird de facto zu einem Artefakt, das auf bestehenden Dokumenten basiert. - nur
API
Nicht mehr ausreichend, könnte aber ein guter Ausgangspunkt sein: Der Entwickler wird feststellen, dass die Daten aus demAPI
Die Abbildung auf Werkzeuge ist selten 1:1. Werkzeuge sind Abstraktionen auf höherer Ebene, die für einen intelligenten Körper zum Zeitpunkt der Aufgabenausführung am sinnvollsten sind - der intelligente Körper kann wählendraft_email_and_send()
Funktion (mit mehrerenAPI
aufzurufen, um die Latenz zu minimieren), anstatt einfach diesend_email()
.MCP
Das Design des Servers wird sich auf Szenarien und Anwendungsfälle konzentrieren und nicht aufAPI
Für das Zentrum. - Es werden neue Hosting-Modelle entstehenWenn jedes Stück Software standardmäßig zu
MCP
Kunden, die eine andere Arbeitslast aufweisen als beim herkömmlichen Webhosting. Jeder Client ist von Natur aus mehrstufig und muss Garantien wie Wiederherstellbarkeit, Wiederholungsversuche und die Verwaltung von Aufgaben mit langer Laufzeit implementieren. Der Hosting-Anbieter muss auch Arbeitslasten über verschiedeneMCP
Die Server werden in Echtzeit ausgelastet, um Kosten, Latenz und Leistung zu optimieren, so dass die KI-Intelligenz zu jedem Zeitpunkt das effizienteste Tool auswählen kann.
MCP
ist bereits dabei, das Ökosystem der KI-Intelligenzen umzugestalten, aber die nächste Welle des Fortschritts wird davon abhängen, wie wir diese grundlegenden Herausforderungen angehen. Wenn wir sie richtig angehen, wird dieMCP
könnte die Standardschnittstelle für die Interaktion von KI mit Werkzeugen werden und eine neue Generation autonomer, multimodaler, tief integrierter KI-Erfahrungen ermöglichen.
Bei einer breiten Anwendung würde dieMCP
Dies könnte einen Wandel in der Art und Weise bedeuten, wie Werkzeuge entwickelt, genutzt und vermarktet werden. Es ist spannend zu sehen, wie sich der Markt entwickeln wird. Dieses Jahr wird von entscheidender Bedeutung sein: Wir werden eine einheitliche MCP
Wird der Markt wachsen? Wird die Zertifizierung von KI-Intelligenzen nahtlos erfolgen? Kann die mehrstufige Implementierung in Protokollen formalisiert werden? Die Antworten auf diese Fragen werden bestimmen MCP
Die endgültige Form und Wirkung der