ClickClickClickClick : permettre à n'importe quel LLM d'automatiser les opérations sur Android et sur PC

Introduction générale

ClickClickClick est un cadre développé par BandarLabs qui vise à automatiser les opérations sur Android et PC en utilisant n'importe quel modèle de langage local ou distant (LLM). Le projet est actuellement en phase expérimentale et supporte plusieurs modèles tels que Ollama, Gemini et GPT 4o. Les utilisateurs peuvent utiliser ClickClickClick pour effectuer une variété de tâches telles que l'envoi de courriels, la navigation sur des cartes, le lancement de jeux, etc. en configurant différents modèles et clés API. Le framework nécessite l'installation d'ADB sur la machine locale et l'activation du mode de débogage USB pour les téléphones Android.

ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

 

ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

 

Liste des fonctions

  • Prise en charge de plusieurs modèles LLM (Ollama, Gemini, GPT 4o)
  • Opérations automatisées sur Android et sur PC
  • Configuration et utilisation des clés API
  • Effectuer plusieurs tâches (envoyer des courriels, parcourir des cartes, lancer des jeux, etc.)
  • Plate-forme d'exécution des tâches hautement configurable

 

Utiliser l'aide

Processus d'installation

  1. Clonez le dépôt et allez dans le répertoire du projet :
   git clone https://github.com/BandarLabs/clickclickclick
cd clickclickclick
  1. Créer un environnement virtuel et l'activer :
   python3 -m venv venv
source venv/bin/activate  # Windows用户使用 `venv\Scripts\activate`
  1. Installer la dépendance :
   pip install -r requirements.txt

Utilisation

  1. Configurer les paramètres du modèle : Dansconfig/models.yamlpour définir la configuration liée au modèle et exporter la clé API correspondante dans l'environnement.
  2. Pour l'utiliser en tant qu'outil CLI : installez l'outil et assurez-vous que vous disposez du fichierOPENAI_API_KEYrépondre en chantantGEMINI_API_KEY: :
   pip install <repo-tar>
click3 run open uber app
  1. Utilisé en tant que script : Par défaut, planner est openai et finder est gemini. se trouve dans le fichierconfig/models.yamlpour modifier la configuration par défaut.
  2. Exécuter la tâche : Utiliserrunpour effectuer la tâche. L'utilisation de base est la suivante :
   python main.py run "<task-prompt>"

Options :

  • --platform: Spécifie la plateforme, la valeur par défaut est Android. Exemple : bash
    python main.py run "example task" --platform=osx
  • --planner-model: Spécifie le modèle du planificateur, qui est par défaut openai. exemple : bash
    python main.py run "example task" --planner-model=gemini
  • --finder-model: Spécifie le modèle du finder, qui est par défaut gemini. exemple : bash
    python main.py run "example task" --finder-model=ollama

exemple de commande (informatique)

L'exemple complet de commande est le suivant :

python main.py run "Open Google news" --platform=android --planner-model=openai --finder-model=gemini
© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...