はじめに
AIウェブ オペレーター は、複数のAI技術とSDKを統合することで、ブラウザでのユーザー体験を簡素化するために設計されたオープンソースのAIブラウザ操作ツールです。BrowserbaseとVercel AI SDKをベースに構築されたこのツールは、以下のような様々な大規模言語モデル(LLM)をサポートしています。 アンソロピック AI Web Operatorは、AI技術に関心のある開発者、研究者、ユーザーに柔軟で拡張性のあるソリューションを提供します。簡単な設定とインストールで、自動化されたブラウザー操作、永続的セッション管理などをすぐに開始できます。
機能一覧
- ブラウザ操作の自動化Browserbase APIと連携してブラウザ操作を自動化。
- 持続的セッション管理永続的なセッションをサポートし、タスクの履歴を保持。
- マルチモデル対応Anthropic Claudeのような様々な大規模言語モデル(LLM)と互換性があります。
- 効率的な開発環境Vercel AI SDKをベースに、効率的な開発・実行環境を提供します。
- オープンソースでスケーラブル完全なオープンソースであるため、ユーザーは二次開発や拡張の需要に基づくことができる。
ヘルプの使用
設置プロセス
- クローン倉庫::
git clone https://github.com/CognosysAI/browser.git
cd browser
- 依存関係のインストールpnpmを使って依存関係をインストールする:
pnpm install
- 環境変数の設定創造
.env.local
ファイルに以下を追加する:
BROWSERBASE_API_KEY=your_key_here
BROWSERBASE_PROJECT_ID=your_key_here
ANTHROPIC_API_KEY=your_key_here
UPSTASH_REDIS_REST_URL=optional_redis_url
UPSTASH_REDIS_REST_TOKEN=optional_redis_token
- 開発サーバーの起動::
pnpm run dev
ブラウザを開いてアクセスする http://localhost:3000
.
機能操作ガイド
- ブラウザ操作の自動化::
- Browserbase APIキーとプロジェクトIDを設定した後、ユーザーはAPIコールを通じて、ページナビゲーション、フォーム入力などのブラウザ操作を自動化することができます。
- 持続的セッション管理::
- Upstash Redisを設定することで、ユーザーは永続的なセッション管理を実装し、タスクの履歴を保持して、その後の操作を容易にすることができる。
- マルチモデル対応::
- Anthropic APIキーの設定後、ユーザーは自然言語処理タスクのために様々な大規模言語モデルを呼び出すことができます。
- 効率的な開発環境::
- Vercel AI SDKに基づき、迅速な反復と展開をサポートする効率的な開発および実行環境を提供します。