Insgesamt 22 Artikel
Tags: Desktop-Automatisierung Intelligenz
Allgemeine Einführung Open Operator ist ein Open-Source-Projekt, das darauf abzielt, Operationen im Browser durch KI-Intelligenzen zu automatisieren. Das von Browserbase entwickelte Projekt kombiniert die Technologien von Stagehand und Browserbase, um es den Benutzern zu ermöglichen, das Verhalten des Browsers durch natürlichsprachliche Befehle zu...
Allgemeine Einführung MobileAgent ist ein leistungsstarker Assistent für die Bedienung von Mobilgeräten, der die Effizienz und Automatisierung der Bedienung von Mobilgeräten durch Multi-Agenten-Kollaboration und erweiterte visuelle Wahrnehmungsmodule verbessern soll. Er wurde vom X-PLUG-Team entwickelt, unterstützt Android- und Harmony-OS-Systeme und ist in der Lage, auf komplexen...
Allgemeine Einführung TankWork ist ein Open-Source-Desktop-Agent-Framework, das entwickelt wurde, um KI in die Lage zu versetzen, Ihren Computer durch Computer Vision und Interaktion auf Systemebene wahrzunehmen und zu steuern. Das Framework ermöglicht Agenten die direkte Steuerung von Computern durch Sprach- und Textbefehle, die Verarbeitung von Live-Bildschirminhalten und die Bereitstellung von kontinuierlichem audiovisuellem Feedback und Manipulation...
Allgemeine Einführung UI-TARS Desktop ist eine grafische Interface-Agent-Anwendung, die auf dem von ByteDance entwickelten UI-TARS (Visual Language Model) basiert. Die Anwendung ermöglicht es Benutzern, Computer durch natürliche Sprache für eine intuitivere und effizientere Mensch-Computer-Interaktion zu steuern.UI-TARS Desktop unterstützt plattformübergreifende...
Allgemeine Einführung Shortest ist ein KI-gestütztes End-to-End-Testframework in natürlicher Sprache, das vom Anti-Work-Team entwickelt wurde. Es basiert auf Playwright und unterstützt die GitHub-Integration und die Zwei-Faktor-Authentifizierung (2FA). Shortests Hauptmerkmal ist das Schreiben von Testfällen in natürlicher Sprache und die Verwendung von Anthropic Cl...
Allgemeine Einführung Midscene.js ist ein KI-gesteuertes Browser-Automatisierungstool, das Webseiten steuert, Assertions durchführt und Daten durch natürlichsprachliche Befehle extrahiert. Es unterstützt Chrome-Erweiterungen, JavaScript-SDKs und YAML-Skripte und vereinfacht so das Schreiben und Warten von UI-Tests. Durch die Nutzung multimodaler großer ...
Allgemeine Einführung Stagehand ist eine AI Web-Browsing-Framework auf Einfachheit und Erweiterbarkeit konzentriert. Es ist vollständig Playwright-kompatibel und bietet drei einfache KI-APIs (Act, Extract und Observe), die auf den zugrundeliegenden Playwright Page-Klassen für das Web durch natürliche Sprache aufgebaut sind...
Allgemeine Einführung Eko ist ein produktionsreifes JavaScript-Framework zur Erstellung effizienter intelligenter Agenten-Workflows durch Beschreibungen in natürlicher Sprache. Es wurde entwickelt, um Entwicklern die Möglichkeit zu geben, alltägliche Aufgaben mit Hilfe von KI-Technologien ohne tiefgreifende Programmierung zu automatisieren....
Allgemeine Beschreibung AutoMouser ist eine Chrome-Erweiterung, die auf intelligente Weise Benutzerinteraktionen verfolgt und automatisch Selenium-Testcode unter Verwendung der GPT-Modelle von OpenAI generiert. Dies geschieht durch die Aufzeichnung von Benutzer-Browser-Aktionen und deren Umwandlung in robuste, wartbare Python-Selenium-Skripte,...
Allgemeine Einführung Browser Use Web UI ist ein innovatives Open-Source-Projekt, das sich auf die Bereitstellung von KI-Agenten mit einer grafischen Schnittstelle Werkzeug für Browser-Interaktion Fähigkeiten konzentriert. Das Projekt baut auf dem Browser-Use-Core-Framework auf, um mit Gradio eine benutzerfreundliche Web-Oberfläche zu erstellen, die es KI-Agenten leicht macht, ...