はじめに
CuaはComputer-Use Agentと呼ばれるオープンソースプロジェクトで、「クーア」と発音する。Cuaは、AppleのVirtualization.Framework技術を使用して、仮想環境内のAIエージェントをサポートしながら、Webの閲覧、コードの書き込みなどのタスクを実行することができます。このプロジェクトは、ユーザーの主要システムの安全な分離と保護に重点を置いている。開発者、技術愛好家、AI研究者のために、MITライセンスのもとGitHubで公開されている。
機能一覧
- Apple Silicon上でmacOSとLinuxの仮想マシンを作成し、実行する。
- 最大90%のネイティブ速度で高性能の仮想化を実現。
- AIエージェントによる仮想マシンの制御をサポートし、ブラウジングやエンコードなどの複雑な操作を行う。
- セキュリティのために、仮想マシンがメインシステムから完全に隔離されていることを確認する。
- コマンドラインツール(Lume CLI)とPythonライブラリは、VMとAIエージェントを簡単に管理するために提供される。
- 複数言語モデル(LLM)の統合をサポート(例:OpenAI、Anthropic)。
- 仮想マシンのイメージや機能をカスタマイズできるオープンソースのフレームワーク。
ヘルプの使用
Cuaのインストールと使用は、仮想マシン管理(Lume CLI)と完全なAIエージェント機能の2つの部分に分かれている。以下はその詳細な手順である。
システム要件
- デバイス:Apple Silicon(M1/M2/M3/M4)を搭載したMac。
- システム:macOS 14(Sonoma)以降。
- Python:3.10以上(AIエージェント機能のみ)。
- ディスク容量:仮想マシンイメージの保存には40GB以上を推奨。
設置プロセス
オプション1:Lume CLI(仮想マシン管理)のみをインストールする。
- ターミナルを開き、ネットワークが開いていることを確認する。
- Lumeをインストールするコマンドを入力する:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/lume/scripts/install.sh)"
- インストールが完了したら
lume --version
バージョンを確認し、インストールが成功したことを確認する。
オプション2:AIエージェントの全機能をインストールする
- まずLume CLIをインストールする(上記の手順と同じ)。
- Pythonライブラリをインストールする:
pip install cua-computer cua-agent
- より多くの機能が必要な場合は、以下のような他のライブラリをインストールすることができる:
pip install cua-core cua-computer-server cua-som pylume
主な機能
仮想マシンの作成と実行
- それをターミナルに入力する:
lume run macos-sequoia-vanilla:latest
これでmacOS Sequoia仮想マシンがダウンロードされ、起動する。
2.仮想マシンが起動すると、独立したデスクトップが表示されます。
3.プレス Ctrl+C
仮想マシンを停止します。
AIエージェントの使用
- 設定環境
AIエージェントライブラリをインストールしたら.env
ファイルにモデル・キーを追加する。例
OPENAI_API_KEY=你的密钥
- 実行例
GitHubのnotebooks
フォルダ内のサンプルコードを見つけてください:
- ターミナルを開いて実行する:
python -m cua_agent.examples.basic_agent
- AIエージェントはスクリーンショットからVMインターフェースを認識し、タスクを実行する。
- カスタムタスク
Python スクリプトを編集して、ウェブページの閲覧やボタンのクリックなど、エージェントの特定のアクションを定義します。
仮想マシンの管理
- リストミラー::
lume images
- ミラー削除::
lume rm macos-sequoia-vanilla:latest
注目の機能操作
高性能仮想化
CuaはアップルのVirtualisation.Frameworkを使用し、追加設定なしでネイティブに近いパフォーマンスを実現する。Geekbenchテストを実行すると、仮想マシンはネイティブで最大90%のパフォーマンスを発揮できることがわかります。
安全な隔離
AIエージェントの動作はメインシステムに影響を与えないため、安全でないコードやアプリケーションのテストに適している。
LLMインテグレーション
Cuaは複数の言語モデルの接続をサポートしています。ユーザーは対応するライブラリをインストールし、キーを設定するだけです。例えば
- Anthropicを使う:
pip install "cua-agent[anthropic]"
export ANTHROPIC_API_KEY=你的密钥
高度な使用
- ドキュメントを見る
GitHubのdocs/Getting-Started.md
もしかしたらlibs/*/README.md
使用法の詳細については - ノートブックのサンプルを実行する
ダウンロードnotebooks
フォルダにあるJupyter Notebookで、AIエージェントがGitHubの問題を修正したり、アプリをクローンしたりするデモを体験できます。 - コードを投稿する
協議CONTRIBUTING.md
また、新機能の追加や問題の修正も行ってください。
ほら
- Appleシリコンのみをサポートし、Intel Macには対応していません。
- 大きな仮想マシンイメージ(例:macOSは20~30GB必要)の場合、十分なディスク容量があることを確認してください。
- AIエージェントは安定したネットワークと有効なAPIキーを必要とする。
アプリケーションシナリオ
- ソフトウェア開発とテスト
開発者はCuaを使って複数の仮想マシンを作成し、macOSやLinux上でアプリケーションをテストする。 - AIによる自動化作業
AIエージェントを設定して、ウェブデータのスクレイピングや文書整理のタスクを自動化する。 - 教育と実験
学生や研究者は、仮想化やAI技術を学ぶために、隔離された環境でコードを実行する。
品質保証
- CuaはどのOSに対応していますか?
macOSとLinuxはサポートされているが、Windowsはサポートされていない。 - 仮想マシンの実行速度は?
Apple SiliconおよびVirtualisationが保証する、ネイティブに近い90%。 - コミュニティに参加するには?
Discord(https://discord.com/invite/mVnXXpdE85)でアイデアを共有したり、助けを求めたりしましょう。