はじめに
Stagehandはシンプルさと拡張性を重視したAIウェブブラウジングフレームワークである。Playwrightと完全に互換性があり、基礎となるPlaywrightページクラスの上に構築された3つのシンプルなAI API(act、extract、observe)を提供し、自然言語によるウェブ自動化のためのビルディングブロックを提供します。Stagehandは、永続的で効率的なブラウザオートメーションコードを書くことを、特に非技術的なユーザーにとって容易にし、UI/DOMの小さな変更に影響されにくくする。Hacker News でその日のトップストーリーを検索するのも、Amazon で商品を検索して購入するのも、Stagehand を使えば簡単です。このフレームワークは現在早期リリース中で、開発チームはコミュニティからのフィードバックを積極的に求めている。
機能一覧
- 3つのシンプルなAI APIを提供:行動、抽出、観察
- Playwrightとの完全な互換性
- 自然言語によるウェブ自動化のサポート
- セッションの再生やステップバイステップのデバッグなどのデバッグツールの提供
- 非技術系ユーザー向け
- 細かいUI/DOMの変更に鈍感
- Browserbaseとの統合をサポートし、より強力なデバッグツールを提供。
ヘルプの使用
設置プロセス
- Stagehand プロジェクトをクローンする:
git clone https://github.com/browserbase/stagehand.git
cd stagehand
- 依存関係をインストールします:
npm インストール
npx playwrightのインストール
- サンプルスクリプトを実行します:
npm run example
使用ガイドライン
新しいプロジェクトを作成する
デフォルト設定で構成された Stagehand プロジェクトを作成するには、以下のコマンドを実行します:
npx create-browser-app --example quickstart
詳しくはクイックスタートガイドをご覧ください。
既存のプロジェクトに追加する
以下のコマンドで、既存の Typescript プロジェクトに Stagehand を追加することができます:
npm install @browserbasehq/stagehand zod
npx playwright インストール
APIキーの設定
Stagehand は LLM プロバイダ API キーと Browserbase クレデンシャルを必要とします。これらをプロジェクトに追加するには
cp .env.example .env
nano .env # .envファイルを編集してAPIキーを追加する。
主な機能
- アクトAPIボタンをクリックする、フォームに入力する、などのアクションを実行するために使用されます。
await page.act('ログインボタンをクリック');
- エキスAPIページからテキストやリンクなどの情報を抽出するために使われる。
const headlines = await page.extract('すべてのニュースの見出しを抽出する');
- APIを観察する: エレメントが表示されるのを待つ、ページの読み込みを監視するなど、ページの変化を観察するために使用されます。
await page.observe('読み込み終了待ち');
デバッグツール
Stagehand と Browserbase の統合は、セッションリプレイやステップバイステップのデバッグといった強力なデバッグツールを提供します。以下の手順でこれらのツールを有効にすることができます:
- Browserbase APIキーをプロジェクトに追加します:
nano .env #にBROWSERBASE_API_KEYとBROWSERBASE_PROJECT_IDを追加する。
- セッション再生を有効にする:
page.enableSessionReplay()を待つ;
- ステップ・バイ・ステップのデバッグを有効にする:
awaitページ.enableStepByStepDebugging();
以下のステップに従うことで、効率的なブラウザ自動化のためにStagehandのパワーをフルに活用することができます。