AI Personal Learning
und praktische Anleitung

Verwandeln Sie Cursor und Windsurf in einer Stunde in Devin im Wert von 500 Dollar/Monat!

Im letzten Beitrag haben wir Devin besprochen, eine Agentic AI, die eine vollautomatische Programmierung ermöglicht. Cursor und Windsurf), bietet sie erhebliche Vorteile in Bezug auf Prozessplanung, Selbstentwicklung, Werkzeugverlängerung und vollautomatischen Betrieb. Das macht Devin Werden Sie eine neue Generation von Tools, die sich von den bestehenden Agentic AI-Tools unterscheiden.

Nachdem ich Devin jedoch eine Weile benutzt hatte, kam meine "Bauherrenmentalität" wieder zum Vorschein und trieb mich dazu Windsurfen und Cursor, um Devin 90% zu implementieren. Dieser Artikel konzentriert sich auf die Besonderheiten dieser Modifikationen und zeigt anhand dieses Beispiels, wie effizient sie im Zeitalter der agentenbasierten KI entwickelt und skaliert werden können. Um die Diskussion zu vereinfachen, werden wir Cursor als Stellvertreter für dieses Tool verwenden und abschließend erörtern, welche kleinen Anpassungen Sie vornehmen müssen, wenn Sie Windsurf verwenden möchten.

Artefakt Prozessplanung Selbstentfaltung Werkzeug Erweiterung Automatisierte Umsetzung Preise
Devin Ja (automatisch, vollständig) Ja (Selbststudium) Multi Adjuvans $500/Monat
Cursor (vor der Änderung) Zwänge Verstopft Begrenztes Instrumentarium Manuelle Bestätigung erforderlich $20/Monat
Cursor (geändert) In der Nähe von Devin. sein Nähe zu Devin, skalierbar Bestätigung oder Lösung noch erforderlich $20/Monat
Windsurfen (modifiziert) In der Nähe von Devin. Ja, aber indirekt Nähe zu Devin, skalierbar Unterstützung für vollständige Automatisierung in Docker-Containern $15/Monat

 

Prozessplanung und Selbstentwicklung

Wie bereits erwähnt, besteht ein interessanter Aspekt von Devin darin, dass es sich eher um einen organisierten Praktikanten handelt. Sie erstellt einen Plan, bevor sie eine Aufgabe ausführt, und aktualisiert den Fortschritt des Plans kontinuierlich während der Ausführung. Dies erleichtert den KI-Managern die Verfolgung des aktuellen Fortschritts und verhindert gleichzeitig, dass die KI vom ursprünglichen Plan abweicht, was zu einer besseren Denkweise und Qualität der Aufgabenerledigung führt.


Diese Funktionalität mag zwar beeindruckend erscheinen, ist aber in Wirklichkeit sehr einfach in Cursor zu implementieren.

Für Cursor öffnen Sie den Stammordner des Ordners mit einer Datei namens .cursorrules Dies ist eine spezielle Datei. Das Besondere an dieser Datei ist, dass Sie mit ihr die Cursor-Cue-Words ändern können, die an ein großes Back-End-Sprachmodell wie GPT oder Claude weitergegeben werden. Mit anderen Worten: Alles, was in dieser Datei steht, wird Teil des Cue-Worts, das an die Back-End-KI gesendet wird, was eine große Flexibilität bei der Anpassung bietet.

Wir könnten zum Beispiel den Inhalt des Plans in dieser Datei speichern, so dass der Cursor bei jeder Interaktion mit dem Cursor die neueste Version des Plans erhält. Wir könnten in dieser Datei auch detailliertere Anweisungen geben, z. B. den Cursor auffordern, den Plan zu Beginn der Aufgabe zu überdenken und zu erstellen und den Plan nach jedem Schritt zu aktualisieren. Da der Cursor mit Hilfe des Agenten die Datei ändern kann und der .cursorrules Es handelt sich um eine eigenständige Datei, die eine geschlossene Schleife bildet. Es liest jedes Mal automatisch den Inhalt der Datei, erkennt die letzte Aktualisierung und schreibt den aktualisierten Fortschritt und die nächsten Schritte in diese Datei, wenn es darüber nachdenkt, um sicherzustellen, dass wir immer die neueste Aktualisierung haben.

Die Funktion der Selbstevolution kann auf die gleiche Weise realisiert werden. In der .cursorrules Datei fügen wir Aufforderungen für den Cursor hinzu, um zu prüfen, ob es eine dokumentierbare wiederverwendbare Erfahrung gibt, wenn der Benutzer den Fehler korrigiert. Wenn dies der Fall ist, aktualisiert er die .cursorrules relevante Teile des Dokuments und sammelt so projektspezifisches Wissen.

Ein typisches Beispiel ist, dass aktuelle Modelle großer Sprachen aufgrund früherer Wissensfristen bei vielen Modellen nichts von der Existenz von GPT-4o wissen. Wenn Sie ihm sagen: "Dieses Modell existiert, Sie wissen es nur nicht", wird es diese Erfahrung in den .cursorrules dokumentiert werden, so dass dieselben Fehler in Zukunft nicht mehr gemacht werden und somit Lernen und Verbesserung möglich sind. Dies hängt jedoch immer noch davon ab, dass der Hinweis effektiv ist - manchmal kann es passieren, dass er Punkte übersieht und Wissen nicht aufzeichnet, von dem wir denken, dass wir es wissen sollten. In diesem Fall können wir auch natürliche Sprache verwenden, um das System direkt aufzufordern, es zu erfassen. Dieser direktere Ansatz kann auch die Erfahrung und das Wachstum der KI fördern.

Infolgedessen kann nur durch .cursorrules Dokumentation und ein paar Tipps und Tricks können wir die Prozessplanung und die Selbstentwicklungsfähigkeiten von Devin zu unseren bestehenden Agentic AI-Programmierwerkzeugen hinzufügen.

Wenn Windsurf verwendet wird, gibt es einen Unterschied: Wahrscheinlich aus Sicherheitsgründen erlaubt es der KI nicht, die Daten direkt zu ändern. .windsurfrules Datei. Daher müssen wir sie in zwei Teile aufteilen, indem wir eine andere Datei (z. B. die scratchpad.md). Unter .windsurfrules In der Dokumentation heißt es, dass Sie vor jedem Denkprozess in Scratchpad nachsehen und den Plan dort aktualisieren sollten. Diese indirekte Methode ist möglicherweise nicht so effektiv wie die direkte Platzierung auf .cursorrules Die KI muss zwar immer noch den Agenten anrufen und auf der Grundlage des Feedbacks denken, aber es funktioniert tatsächlich.

 

Werkzeug Erweiterung

Einer der Hauptvorteile von Devin gegenüber Cursor ist die Möglichkeit, mehr Werkzeuge zu verwenden. Zum Beispiel kann esRufen Sie Ihren Browser auf, um zu suchen, im Web zu surfen und sogar die LLM-Intelligenz zur Analyse von Inhalten zu nutzen!. Obwohl Cursor diese Funktionen standardmäßig nicht unterstützt, können wir sie glücklicherweise mit der Option .cursorrules Die direkte Kontrolle über das Prompt-Wort des Cursors und die Tatsache, dass er Befehle ausführen kann, schafft eine weitere geschlossene Schleife. Wir können vorgefertigte Programme vorbereiten (z.B. Python-Bibliotheken oder Kommandozeilen-Tools) und sie dann in den .cursorrules Der Cursor wird mit diesen Werkzeugen vertraut gemacht, so dass er lernen kann, sie zu benutzen und Dinge zu erledigen.

Die Werkzeuge selbst können in wenigen Minuten mit Cursor geschrieben werden. Für die Web-Browsing-Funktionalität kann zum Beispiel die Devin.cursorrules Eine Referenzimplementierung finden Sie in Es gibt einige technische Entscheidungen zu beachten, wie z. B. die Verwendung von Browser-Automatisierungstools (z. B. Playwright) anstelle der Python-Anforderungsbibliothek für JavaScript-intensive Websites. Um eine bessere Kommunikation mit LLM zu ermöglichen und ihm zu helfen, die nachfolgenden Inhalte zu verstehen und zu crawlen, folgen wir außerdem bestimmten Regeln für die Konvertierung in das Markdown-Format, das detailliertere grundlegende Informationen (wie Klassennamen und Hyperlinks) beibehält und LLMs Fähigkeit unterstützt, nachfolgende Crawler auf einer einfacheren Ebene zu schreiben, anstatt einfach nur den Textinhalt einer Webseite zu extrahieren.

Auch bei den Suchtools gibt es ein kleines Detail: Sowohl Bing als auch Google haben API-Suchen, die weit weniger hochwertig sind als clientseitige Suchen, was vor allem darauf zurückzuführen ist, dass APIs und Webschnittstellen von verschiedenen Teams gepflegt werden. DuckDuckGo hat dieses Problem jedoch nicht, daher verwendet unsere Referenzimplementierung die kostenlose API von DuckDuckGo.

Was die Nutzung der eigenen Intelligenz von Cursor zur Tiefenanalyse betrifft, so ist dies relativ komplex. Einerseits verfügt Cursor bis zu einem gewissen Grad über diese Fähigkeit - wenn wir in den beiden oben genannten Tools den Inhalt einer Webseite auf stdout ausgeben, wird dieser Teil von Cursors Hinweis an den LLM, was es ihm ermöglicht, diesen Textinhalt intelligent zu analysieren. Auf der anderen Seite hat Devin jedoch die einzigartige Fähigkeit, relativ große Textmengen mit dem LLM in einer Weise zu verarbeiten, wie es Cursor nicht kann. Dazu haben wir ein zusätzliches Tool implementiert - es ist sehr einfach, den API-Schlüssel auf Ihrem System vorzugeben und dann das Tool GPT, Claude oder die native LLM-API aufrufen zu lassen, um Cursor die Möglichkeit zu geben, Textstapelverarbeitung mit LLM durchzuführen. In meiner Referenzimplementierung habe ich meinen eigenen lokalen vllm-Cluster verwendet, aber die Änderung war sehr einfach - entfernen Sie einfach die Zeile base_url.

Trotz dieser Änderungen gibt es immer noch zwei Werkzeuge, die aufgrund der Einschränkungen von Cursor nicht implementiert werden können:

  1. Devin scheint die Fähigkeit zu haben, Bilder zu verstehen, was es ihm ermöglicht, Front-End-Interaktionen und Tests durchzuführen, aber aufgrund der Einschränkungen des Cursors können wir keine Bilder als Eingabe an die Back-End-KI weitergeben - was Änderungen an der Implementierung erfordern würde.
  2. Devin wird von Anti-Crawling-Algorithmen während der Datenerfassung nicht als Bot eingestuft, während unsere Websuch-Tools oft mit CAPTCHA arbeiten oder blockiert werden. Möglicherweise lässt sich dies beheben und ich bin noch dabei, es zu erforschen, aber es ist sicherlich eine der einzigartigen Stärken von Devin.

Vollständig automatisierte Implementierung

Die letzte interessante Funktion ist die vollautomatische Ausführung. Da Devin in einer vollständig virtualisierten Cloud-Umgebung läuft, können wir es getrost verschiedene Befehle ausführen lassen, ohne uns Sorgen über LLM-Angriffe oder die falsche Ausführung gefährlicher Befehle zu machen. Selbst wenn das gesamte System gelöscht wird, kann es wiederhergestellt werden, indem einfach ein neuer Container gestartet wird. Da Cursor jedoch auf einem lokalen Host-System läuft, ist die Sicherheit ein ernsthaftes Problem. Deshalb müssen wir im Agentenmodus von Cursor jeden Befehl manuell bestätigen, bevor er ausgeführt wird. Dies ist für relativ einfache Aufgaben akzeptabel, aber mit einer ausgefeilten Prozessplanung und der Fähigkeit, sich selbst weiterzuentwickeln, ist Cursor nun auch in der Lage, langfristige komplexe Aufgaben zu bewältigen, was diese Art der Interaktion mit seinen Fähigkeiten unvereinbar erscheinen lässt.

Um dieses Problem zu lösen, habe ich noch keine Lösung auf der Grundlage von Cursor gefunden (Update: 17. Dezember 2024 Cursor fügt diese Funktion, den sogenannten Yolo-Modus, hinzu, unterstützt aber immer noch nicht die Entwicklung in Docker), aber Windsurf trägt dem Rechnung. Wie Sie an seinem Design erkennen können, zielt es auf eine Produktform im Stil von Devin ab, und der aktuelle Code-Editor ist nur eine Zwischenform. Genauer gesagt, verfügt Windsurf über eine Funktion, die sich direkt mit einem Docker-Container verbinden und ihn dort ausführen kann, oder wenn wir eine Konfigurationsdatei haben, kann es uns helfen, einen neuen Docker-Container zu starten, einige Initialisierungen durchzuführen und einen lokalen Ordner zuzuordnen. Auf diese Weise finden alle ausgeführten Befehle (mit Ausnahme der Änderungen am lokalen Ordner) im Docker-Container statt und haben keine Auswirkungen auf das Host-System, was die Sicherheit erheblich erhöht.[Beispielkonfiguration]

Darüber hinaus führt er einen Blacklist/Whitelist-Mechanismus ein, der Befehle in der Blacklist automatisch ablehnt und Befehle in der Whitelist zulässt. Bei Befehlen, die weder auf der Blacklist noch auf der Whitelist stehen, ermittelt der LLM auf intelligente Weise, ob ein Risiko für das Hostsystem besteht - wenn er zum Beispiel eine Datei in einem Ordner löschen will, fragt er den Benutzer nach einer Bestätigung, aber Befehle wie Pip-Installation Gewöhnliche Befehle wie diese sind einfach erlaubt. Beachten Sie, dass diese Funktion nur bei der Ausführung in Docker-Containern aktiviert zu sein scheint. Wenn wir Befehle auf dem Hostsystem ausführen, ist die Erfahrung immer noch ähnlich wie bei Cursor und erfordert eine häufige Bestätigung. Außerdem muss die automatische Befehlsausführung in der Konfiguration aktiviert werden.

 

Zusammenfassungen

Wir sehen also, dass die Produktform und die Designphilosophie von Devin zwar sehr fortschrittlich sind, dass aber der Abstand zu den bestehenden KI-Tools für Agenten nicht so groß ist, wie wir aus der Perspektive der technischen Schwellenwerte vielleicht denken. Mit gängigen Tools wie Cursor und Windsurf (nur $15-20 pro Monat) können wir die Funktionalität von Devin 90% in weniger als einer Stunde implementieren und damit komplexe Aufgaben durchführen, die wir vor den Änderungen nicht erledigen konnten. Ich habe Cursor zum Beispiel mit der Aufgabe betraut, die Renditen beliebter Tech-Aktien in den letzten fünf Jahren zu analysieren, und es hat einen sehr detaillierten und umfassenden Bericht geliefert. Außerdem habe ich Windsurf beauftragt, die Veröffentlichungszeiten der 100 beliebtesten Beiträge in meinem Blog zu ermitteln und die Daten im Stil eines GitHub-Beitragsdiagramms zu visualisieren - Aufgaben, die das Programm vollständig automatisieren kann. Diese Art von Aufgaben sind mit dem herkömmlichen Cursor und Windsurf nicht möglich - nur Devin kann sie erledigen, aber mit einer einfachen Änderung können wir die Ergebnisse des $20/Monat-Tools mit dem $500/Monat-Tool erreichen. Ich habe sogar ein ausführlicheres Experiment durchgeführt: Als Entwickler, der mit der Front-End-Entwicklung überhaupt nicht vertraut ist, habe ich anderthalb Stunden damit verbracht, eine Jobbörse zu erstellen, sowohl im Front-End als auch im Back-End. Diese Effizienz ist mit der von Devin vergleichbar, wenn nicht sogar höher.

Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Verwandeln Sie Cursor und Windsurf in einer Stunde in Devin im Wert von 500 Dollar/Monat!

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)