AppAgent: operação automatizada de smartphones usando inteligências multimodais
Introdução abrangente O AppAgent é uma estrutura de agente multimodal baseada no Large Language Model (LLM), projetada para manipular aplicativos de smartphones. A estrutura imita as interações humanas, como toques e deslizes, por meio de um espaço de manipulação simplificado, eliminando, assim, a necessidade de acesso ao back-end do sistema e ampliando seu uso entre aplicativos...