Allgemeine Einführung
ClickClickClick ist ein von BandarLabs entwickeltes Framework, das darauf abzielt, Android- und PC-Operationen zu automatisieren, indem jedes lokale oder entfernte Large Language Model (LLM) verwendet wird. Das Projekt befindet sich derzeit in einer sehr experimentellen Phase und unterstützt mehrere Modelle wie Ollama, Gemini und GPT 4o. Benutzer können ClickClickClick verwenden, um eine Vielzahl von Aufgaben wie das Senden von E-Mails, das Durchsuchen von Karten, das Starten von Spielen usw. durchzuführen, indem sie verschiedene Modelle und API-Schlüssel konfigurieren. Das Framework setzt voraus, dass ADB auf dem lokalen Rechner installiert ist und der USB-Debugging-Modus für Android-Telefone aktiviert ist.
Funktionsliste
- Unterstützung für mehrere LLM-Modelle (Ollama, Gemini, GPT 4o)
- Automatisierter Betrieb von Android und PC
- Konfigurieren und Verwenden von API-Schlüsseln
- Durchführung mehrerer Aufgaben (E-Mail senden, Karten durchsuchen, Spiele starten usw.)
- Hochgradig konfigurierbare Plattform zur Ausführung von Aufgaben
Hilfe verwenden
Ablauf der Installation
- Klonen Sie das Repository und wechseln Sie in das Projektverzeichnis:
git clone https://github.com/BandarLabs/clickclickclick
cd clickclickclick
- Erstellen Sie eine virtuelle Umgebung und aktivieren Sie sie:
python3 -m venv venv
source venv/bin/activate # Windows-Benutzer verwenden `venv\Scripts\activate`.
- Installieren Sie die Abhängigkeit:
pip install -r anforderungen.txt
Verwendung
- Konfigurieren Sie die Modelleinstellungen: In
config/models.yaml
Datei, um die modellbezogene Konfiguration festzulegen und den entsprechenden API-Schlüssel in die Umgebung zu exportieren. - Zur Verwendung als CLI-Tool: Installieren Sie das Tool und stellen Sie sicher, dass Sie die
OPENAI_API_KEY
im Gesang antwortenGEMINI_API_KEY
::
pip install
click3 run open uber app
- Als Skript verwendet: Standardmäßig ist der Planer openai und der Finder gemini. finden Sie in der
config/models.yaml
um die Standardkonfiguration zu ändern. - Führen Sie die Aufgabe aus: Verwenden Sie
laufen.
Befehl, um die Aufgabe auszuführen. Die grundlegende Verwendung ist wie folgt:
python main.py run ""
Optionen:
---Plattform
Plattform: Geben Sie die Plattform an, der Standard ist Android. Beispiel:bash
python main.py run "Beispielaufgabe" --platform=osx
--planner-model
Gibt das Planermodell an, das standardmäßig auf openai eingestellt ist. beispiel:bash
python main.py run "Beispielaufgabe" --planner-model=gemini
-finder-model
: Gibt das Findermodell an, das standardmäßig auf gemini eingestellt ist. beispiel:bash
python main.py run "Beispielaufgabe" --finder-model=ollama
Beispielbefehl (Rechnen)
Der vollständige Beispielbefehl lautet wie folgt:
python main.py run "Google News öffnen" --platform=android --planner-model=openai --finder-model=gemini