Kürzlich wurde eine der weltweit ersten Allzweck-Intelligenzen (Agent) Manus Manus hat eine Vorabversion veröffentlicht, und die offiziellen Ergebnisse sind verblüffend. Im Gegensatz zu vielen KIs, die nur auf der Ebene der "Vorschläge" bleiben, zeigt Manus nicht nur starke Fähigkeiten bei der Aufgabenplanung, sondern erreicht auch einen qualitativen Sprung bei der Aufgabenausführung, indem es wirklich einen geschlossenen Kreislauf von der Planung zur Ausführung erreicht. Wie funktioniert Manus also? In diesem Artikel geben wir Ihnen einen detaillierten Einblick in den Workflow, den Speicher und die Frontend-Interaktion von Manus und analysieren, wie es Computeroperationen, tiefgreifende Forschung, Kodieragenten und andere Technologien integriert, um das Ziel "weniger ist mehr" zu erreichen. "Weniger ist mehr" - intelligente Emergenz.
I. Papier ade: Manus' "Planen-Ausführen-Aktualisieren-Liefern"-Workflow
Während viele KI-Assistenten zwar gut in der Planung, aber schwer in der Umsetzung sind, verfolgt Manus einen anderen Ansatz und geht nahtlos von der Planung zur Ausführung über, so dass er den menschlichen Arbeitsgewohnheiten näher kommt. Im Kern erstellt Manus eine in Markdown formatierte Liste von Aufgaben (todo.md) und verwaltet den gesamten Lebenszyklus von Aufgaben über diese Liste. Dieser Ansatz ist viel intuitiver und effizienter als viele Systeme, die Aufgaben über den Kontext eines Planungsagenten verwalten.
In der obigen Abbildung sehen Sie ein Beispiel für eine todo.md-Datei zur Planung einer "7-tägigen Japanreise und Vorschlagsplanung". Sie listet nicht nur die zu erledigenden Aufgaben auf, sondern kennzeichnet auch den Erledigungsstatus der Aufgaben mit "[ ]" und "[x]". Dies ist nicht nur intuitiv und übersichtlich, sondern auch für den Agenten leichter zu verwalten und zu aktualisieren, was es zum "Gedächtnis" von Manus macht.
1. die Planung: alles beginnt mit todo.md
Der Manus-Workflow beginnt mit einer ausführlichen Aufgabenliste. Diese Liste in Form einer Markdown-Datei ist nicht nur der Ausgangspunkt für die Aufgabe, sondern auch das Gedächtnis des Agenten. Der Benutzer muss alle Aufgaben so detailliert wie möglich auflisten, um Manus eine klare Anleitung zu geben, was zu tun ist.
2. die Umsetzung: Computeroperationen, eingehende Untersuchungen, Kodieragenten, ein dreigliedriger Ansatz
Mit einer klaren Liste von Aufgaben begann Manus, eine nach der anderen in Angriff zu nehmen. Dabei bewies Manus eine starke Kombination aus Computermanipulation, gründlicher Recherche und Kodieragenten.
- eingehende StudieManus verfügt über leistungsstarke Funktionen für die Informationsbeschaffung und die Interaktion mit Webseiten. Es kann eine große Anzahl von Webseiten auf einmal durchsuchen (23 in der Demo) und verschiedene Benutzeraktionen im Browser simulieren, wie z. B. Scrollen und Klicken. Jeder Schritt wird in einem Bildschirmfoto festgehalten, so dass der Benutzer seine Schritte leicht nachvollziehen kann.
- Durchsuchen:
- Scrollen Sie nach unten:
- Klicken Sie:
- Durchsuchen:
- ComputerbedienungManus ist in der Lage, mit dem Betriebssystem einer virtuellen Maschine zu interagieren, Terminalbefehle auszuführen, Dateien zu verwalten (Erstellen, Löschen, Ändern), einen Browser zu bedienen und eine echte "Computernutzung" zu erreichen.
Manus führt Terminalbefehle aus
Manus Verwaltung von Projektdokumenten
KodiermittelKodierungsaufgaben werden von Manus an spezialisierte Kodierungsagenten vergeben. Der Effekt soll ähnlich sein wie bei der Verwendung des Claude Modelle, die in der Lage sind, hochwertigen Code zu erzeugen (z. B. HTML, Python usw.).
Von Manus erzeugter HTML-Code
3. aktualisieren: Verfolgung in Echtzeit, Fortschritte auf einen Blick
Während der Ausführung der Aufgaben aktualisiert Manus die Datei todo.md in Echtzeit und markiert erledigte Aufgaben mit "[x]". Auf diese Weise wird der Fortschritt der Aufgaben klar aufgezeichnet, und der Benutzer hat ein klares Bild vom Status der Arbeit von Manus.
Manus aktualisiert die Datei todo.md
4. die Lieferung: Ergebnisse in Reichweite
Manus generiert das endgültige Ergebnis, wenn alle Aufgaben in der Datei todo.md als erledigt markiert sind. Um die Benutzerfreundlichkeit zu erhöhen, bietet Manus auch eine spezielle Schnittstelle für die Verwaltung von Sitzungsdateien, über die die Benutzer die generierten Dateien anzeigen und verwalten können.
Von Manus erstellte Lieferdokumente
Verwaltung von Manus-Sitzungsdateien
Mehr als "Erinnern": Der selbstlernende Gedächtnismechanismus von Manus
Manus merkt sich nicht nur Benutzerbefehle, sondern lernt auch von ihnen. Seine einzigartigen Wissens- und Gedächtnismechanismen ermöglichen es ihm, Benutzerpräferenzen und bewährte Verfahren für bestimmte Aufgaben zu lernen und diese Lektionen automatisch anzuwenden, wenn ähnliche Aufgaben anfallen.
Dies bedeutet, dass die Benutzer ihre Produktivität und Genauigkeit kontinuierlich verbessern können, indem sie Manus "beibringen", wie bestimmte Aufgaben zu erledigen sind. Sie können Manus zum Beispiel anweisen, die Ergebnisse in einer Tabelle zusammenzufassen, wenn Sie einen Lebenslauf bearbeiten, und Manus wird dies automatisch tun, wenn es das nächste Mal auf eine ähnliche Aufgabe trifft, anstatt die Anweisung zu wiederholen. Diese Fähigkeit des "Learning by doing" macht Manus so intelligent.
Mehr als nur "funktioniert": Das ultimative interaktive Erlebnis von Manus
Manus ist nicht nur leistungsstark, sondern bietet auch ein großartiges Benutzererlebnis. Der sanfte Ausgabeeffekt der Sitzungswiedergabe und die Echtzeit-Fortschrittsverfolgung auf der rechten Seite lassen die Nutzer jederzeit den Arbeitsstatus von Manus erkennen, als ob sie einen "sichtbaren" KI-Assistenten hätten. Dieses Design verbessert nicht nur das Benutzererlebnis, sondern stärkt auch das Vertrauen des Benutzers in Manus.
Manus-Sitzungsschnittstelle mit Fortschrittsverfolgung in Echtzeit
IV. Fazit: Weniger ist mehr, Intelligenz entsteht
Das Manus-Team hält sich an das Konzept "weniger Struktur, mehr Intelligenz", was bedeutet, dass durch hochwertige Daten, leistungsstarke Modelle, flexible Architektur und solide Technik Computeroperationen, tiefgreifende Forschung, Kodieragenten und andere Fähigkeiten auf natürliche Weise entstehen, anstatt einfach nur Funktionen zu stapeln.
Manus kombiniert Computeroperationen, gründliche Forschung, Kodierungsagenten und andere Technologien, um einen wirklich geschlossenen Kreislauf von der Aufgabenplanung bis zur Ausführung durch einfaches und effizientes Markdown-Aufgabenmanagement und hervorragendes Front-End-Interaktionsdesign zu erreichen. Diese "weniger ist mehr"-Designphilosophie und die Durchbrüche im Bereich der Allzweckagenten sind vielleicht der Grund, warum Manus es wagt, zu behaupten, "Allzweckagenten neu zu definieren".
Dieser Artikel basiert hauptsächlich auf der offiziellen Demo zu analysieren, kann es Verständnis für die Abweichung, sind die Leser willkommen, Korrekturen auszutauschen, und gemeinsam die künftige Entwicklung des gemeinsamen Agenten zu erkunden.
Über Manus ist, was, viele große Bruder letzte Nacht hatte auch eine Diskussion, in der Tat, das Problem ist sehr einfach, Manus veröffentlicht die erste Praxis wurde im Prinzip erklärt:Manus Was genau ist eine Universelle Intelligenz?und die Antwort von AIGCLINK ist im Wesentlichen die gleiche.
AIGCLINKs Ansicht zu Agent