AppAgent: automatisierte Smartphone-Bedienung durch multimodale Intelligenz
Umfassende Einführung AppAgent ist ein Large Language Model (LLM)-basiertes multimodales Agenten-Framework, das für die Handhabung von Smartphone-Anwendungen entwickelt wurde. Das Framework ahmt menschliche Interaktionen wie Taps und Swipes durch einen vereinfachten Manipulationsraum nach, wodurch die Notwendigkeit eines System-Backend-Zugriffs entfällt und die Nutzung über Anwendungen hinweg erweitert wird...