はじめに
BrowserAgentは、ブラウザ上で直接AIワークフローを作成・実行するツールです。使い方は簡単で、コードを書く必要はなく、ユーザーは希望のワークフローを記述するだけで、AIが自動的に生成される。その中心的な特徴は、完全にプライベートであることで、プライバシー漏えいを心配することなく、すべてのデータがブラウザ上で処理される。他のAIツールと比較して、BrowserAgentは使用ごとに課金するのではなく、無制限に実行できる手頃なモデルを提供している。高価で複雑なAIツールの限界を打ち破り、より多くの人がAIを簡単に使えるようにしたいと考えた開発者グループによって作られたこのウェブサイトは、2025年3月15日にProductHuntで正式にデビューし、現在多くの注目を集めている。
機能一覧
- AIワークフローの作成ユーザーがテキストでタスクを記述すると、AIが実行可能なワークフローを自動生成します。
- ブラウザはすべての操作は、サーバーのサポートなしで、ブラウザーのローカルで行われます。
- コードエディターなしプログラミングの知識がなくても複雑なプロセスを設計できるビジュアル・インターフェースを提供します。
- プライバシーデータはクラウドにアップロードされず、ユーザーの端末で処理される。
- 無期限に走る1回のお支払いで何度でもご利用いただけます。
- 多様なミッションへの対応フォーム入力、データキャプチャ、価格比較、その他のシナリオに適しています。
ヘルプの使用
BrowserAgentの使い方は非常に簡単で、複雑なソフトウェアをインストールする必要はなく、ブラウザを開くだけで準備完了です。以下では、BrowserAgentの始め方と主な機能について詳しく説明します。
始め方
- ウェブサイトへのアクセス
ブラウザを開き、ホームページにアクセスする。始める」または「試す」ボタンのあるシンプルなインターフェイスが表示されます。 - 登録またはログイン
Get Started "をクリックすると、アカウントの登録画面が表示されます。登録にはEメールとパスワードを使ってください。新規ユーザーであれば、無料トライアルを試すか、手頃なパッケージを購入することができます(現在、50%割引があります。) - ワークスペースに入る
ログイン後、ワークスペースに移動します。ここでAIワークフローを作成・管理する。
最初のAIワークフローを作成する
- 新規ワークフロー」をクリック
ワークスペースの左上にある "New Workflow "ボタンをクリックします。 - タスクを説明する
入力ボックスがポップアップ表示され、タスクをテキストで記述するよう求められる。例えば、「ウェブサイトを開き、見出しのテキストを取得する」とか、「ログインフォームに入力し、自動的に送信する」と入力することができます。できるだけ具体的に入力しましょう。 - ワークフローの生成
生成」ボタンをクリックすると、AIがあなたの記述に基づいてワークフローを作成します。生成されると、各ステップを示すフローチャートが表示されます。 - 調整プロセス(オプション)
変更が必要な場合は、フローチャート内のモジュールをマウスでドラッグするか、クリックして詳細を調整します。インターフェースは直感的で、積み木のようにシンプルです。 - ワークフローの実行
実行」ボタンをクリックすると、BrowserAgentがブラウザ上でタスクを実行します。取得したデータやフォームへの入力状況など、リアルタイムの進捗を確認することができます。
注目機能 操作手順
データクロール
- 取るニュースサイトで最新のヘッドラインを見ようとする。
- リグ::
- 新しいワークフローを作成し、"Open https://news.ycombinator.com and grab header text "と入力する。
- AI生成プロセスの後、"Navigate to URL "と "Crawl Element "のステップを確認する。
- Grab Elementsモジュールで、CSSセレクタ「.titleline a」を入力します(これはハッカーニュースのタイトル用のセレクタです。CSSを知らない場合は、AIに推薦してもらうことができます)。
- Run "をクリックすると、"so-and-so news headline "のような結果が画面に表示される。
- 注意を引くクロールに失敗した場合は、セレクターを調整するか、コミュニティで助けを求める。
自動フォーム入力
- 取るウェブサイトに自動的にログインする。
- リグ::
- example.com/loginを開き、ユーザー名'myUser'、パスワード'myPass'を入力し、Submitボタンをクリックする。
- AIがフローを生成した後、ステップを確認する:URLに移動し、フォームに記入し、ボタンをクリックする。
- Fill Form "モジュールで、ユーザー名フィールドとパスワードフィールドのID(例:"#username "と "#password")を確認します。ユーザー名とパスワードフィールドのID(例:「#username」と「#password」)を確認します。
- Click Button "モジュールに、送信ボタンのIDを入力します(例:"#submitBtn")。
- 実行後、ブラウザは自動的にログインを完了します。
- 注意を引くCAPTCHAのトリガーを避けるために、サイトが自動化を許可していることを確認してください。
価格比較
- 取る複数のeコマースサイトの価格を比較することができます。
- リグ::
- 「site1.com、site2.comを開き、商品の価格を把握し、リストに整理する」と入力する。
- AI生成プロセスの後、各ウェブサイトの価格キャプチャモジュールをチェックする。
- 各サイトに価格のCSSセレクタ(例:".price")を設定します。
- 実行すると、比較のための価格リストが表示されます。
- 注意を引く結果を保存」機能を使って、データを表に書き出すことができます。
実技
- テスト中にコンポーネントを調整する何か問題が発生したら、"Log "をクリックして、何が問題なのかを確認してください。
- 地域支援サイトにはDiscordのリンクがあり、質問やワークフローの共有ができる。
- (ショートカットキーCtrl+R "で現在のワークフローを素早く実行することができます。
ほら
- ブラウザがWebAssemblyをサポートしていることを確認してください。WebAssemblyは、AIモデルを実行するためにBrowserAgentによって使用されるからです。
- タスクが複雑な場合は、具体的なURLや要素名など、できるだけ詳細に記述する。
- データはすべてローカルで処理されるが、大きなタスクを実行する際には、デバイスの性能を維持しなければならない。
BrowserAgentを使えば、AIのハードルが下がることがわかるだろう。データの取得であれ、フォームへの入力であれ、タイピングができれば、AIに仕事を任せることができる。