はじめに
ClickClickClickはBandarLabsによって開発されたフレームワークで、ローカルまたはリモートのLarge Language Model (LLM)を使用してAndroidやPCの操作を自動化することを目的としています。このプロジェクトは現在非常に実験的な段階にあり、Ollama、Gemini、GPT 4oなどの複数のモデルをサポートしています。ユーザーはClickClickClickを使って、さまざまなモデルとAPIキーを設定することで、電子メールの送信、マップの閲覧、ゲームの起動など、さまざまなタスクを実行できます。このフレームワークは、ローカルマシンにADBをインストールし、Android携帯のUSBデバッグモードを有効にする必要があります。
機能一覧
- 複数のLLMモデルをサポート(Ollama、Gemini、GPT 4o)
- アンドロイドとPCの自動操作
- APIキーの設定と使用
- 複数のタスクの実行(電子メールの送信、マップの閲覧、ゲームの起動など)
- 高度に設定可能なタスク実行プラットフォーム
ヘルプの使用
設置プロセス
- リポジトリをクローンし、プロジェクト・ディレクトリに移動する:
git clone https://github.com/BandarLabs/clickclickclick
cd clickclickclick
- 仮想環境を作成し、起動する:
python3 -m venv venv
source venv/bin/activate # Windowsユーザーは`venvScriptsactivate`を使う。
- 依存関係をインストールします:
pip install -r requirements.txt
使用方法
- モデル設定の構成
config/models.yaml
ファイルでモデル関連のコンフィギュレーションを設定し、対応するAPIキーを環境にエクスポートします。 - CLIツールとして使用する場合:ツールをインストールし
OPENAI_API_KEY
歌で応えるGEMINI_API_KEY
::
pip install をインストールする。
クリック3 uberアプリを開く
- スクリプトとして使用:デフォルトでは、プランナーはopenai、ファインダーはgeminiです。
config/models.yaml
をクリックしてデフォルトの設定を変更してください。 - タスクの実行
走る
コマンドでタスクを実行する。基本的な使い方は以下の通り:
python main.py run ""
オプション
--プラットフォーム
デフォルトはAndroidです。例バッシュ
python main.py run "example task" --platform=osx
--プランナーモデル
デフォルトはopenaiである:バッシュ
python main.py run "example task" --planner-model=gemini
--ファインダーモデル
デフォルトはgemini:バッシュ
python main.py run "example task" --finder-model=ollama
サンプルコマンド(コンピューティング)
コマンドの完全なサンプルは以下の通り:
python main.py run "Open Google news" --platform=android --planner-model=openai --finder-model=gemini