はじめに
AirtopはAIベースのブラウザ自動化ツールである。ユーザーがクラウドブラウザを操作して、ウェブサイトへのログイン、データのクロール、自動化されたタスクの実行など、複雑なウェブ操作を簡単な自然言語コマンドで実行できる。従来のスクリプティングの複雑さやエラーを起こしやすい性質を解決し、特に複数の認証(OAuthや二重認証など)を扱う必要があるシナリオに適しています。Airtopの中核にあるのはクラウド・ブラウザ・テクノロジーで、大規模なタスクのニーズに合わせて複数のブラウザ・インスタンスに簡単に拡張できます。また、Airtopはリアルタイムの人的介入も可能で、必要に応じてユーザーが操作を引き継ぐこともできる。つまり、Airtopは面倒なウェブ自動化をより直感的かつ効率的にするのだ。
機能一覧
- 自然言語制御例えば、「ウェブサイトにログインする」とか「ページデータを取得する」とか。
- クラウドブラウザ対応スケーラブルなクラウドベースのブラウザを提供し、単一または大規模な運用に対応。
- 複雑な認証処理OAuth、二重認証(2FA)、CAPTCHAをサポートし、ログインが必要なウェブサイトへのアクセスを容易にします。
- データの取得と抽出製品情報や検索結果など、ウェブページから構造化データを抽出する機能。
- オンライン人的介入ライブビュー機能により、いつでもブラウザの操作を引き継ぐことができます。
- ファイル操作サポートファイルのアップロードやダウンロード、コピー&ペーストなどの基本機能をサポート。
- APIの統合TypeScriptとPython用のSDKが用意されており、開発者はプロジェクトに組み込むことができる。
ヘルプの使用
Airtopの使い方はとても簡単で、複雑なインストール作業は必要なく、アカウント登録をして公式サイトからアクセスするだけです。以下では、Airtopの始め方と主な機能について詳しく説明します。
始め方
- 登録とログイン
https://www.airtop.ai/ を開き、右上の「サインアップ」ボタンをクリックし、メールアドレスとパスワードを入力して登録を完了します。登録後ログインすると、エアトップのコントロールパネルが表示されます。 - ブラウザセッションの作成
ログイン後、「Create Session」ボタンをクリックすると、システムが自動的にクラウドブラウザを割り当てます。ブラウザの解像度を選択できます(デフォルトは人間サイズ、例:1920x1080)。 - 自然言語コマンドの使用
コントロールパネルで、入力ボックスを見つけて、コマンドを直接入力する。例えば、ブラウザでGoogleを開きたい場合、「open Google homepage」と入力すれば、AirtopのAIがコマンドを解析し、実行する。
主な機能
1.自然言語コントロール
- 手続き::
入力ボックスに「Airtopの最新ニュースを検索する」など、特定のコマンドを入力します。ブラウザが自動的に検索エンジンを開き、キーワードを入力して結果を表示する。また、「ページの最初のリンクをクリックしてください」と入力すると、AIが人間のクリック行動をシミュレートします。 - ほら::
コマンドはできるだけ明確かつ具体的に記述し、曖昧な記述は避けること。コマンドが正しく実行されない場合は、ライブビューでブラウザの状態を確認することができます。
2.認証の取り扱い
- 手続き::
対象のウェブサイトにログインする必要がある場合は、まず「[ウェブサイトのアドレス]を開く」を入力します。その後、ライブビュー機能(「ライブビューURLを生成」をクリックしてリンクを生成)を使用して、アカウントのパスワードを入力するか、QRコードをスキャンするなどして手動でログインすることができます。ログイン後、「Save Session Profile」をクリックし、現在のセッション状態を保存します。その後、保存されたセッションを使用して、再度手動で行うことなく、ログインしたページに直接アクセスできます。 - 注目の使い方::
二重認証が必要なウェブサイトでは、ライブビューで認証コードをリアルタイムに入力できます。セッションを保存した後、AIエージェントは「注文リストを取得する」などのアクションを続けることができます。
3.データの取得と抽出
- 手続き::
eコマース・サイトから商品情報を取り込みたい場合、まず「[eコマース・サイト]を開き、携帯電話を検索する」と入力する。ページが読み込まれたら、「ページ上のすべての商品名と価格を抽出」と入力する。airtopは構造化されたデータ(JSON形式など)を返すので、直接ダウンロードするか、API経由で取得することができる。 - 高度な使用法::
ページがページ分割されている場合、「次のページをクリックしてデータの抽出を続ける」と入力すると、Airtopは自動的にページをめくり、すべてのデータを要約します。
4.リアルタイムでの人間の介入
- 手続き::
AI操作に問題が発生した場合は、いつでも「ライブビュー」ボタンをクリックしてライブリンクを生成します。リンクが開いたら、ローカル・ブラウザーを操作するように、CAPTCHAを解いたり、ページ・レイアウトを調整したりするような複雑な作業を手動で行うことができます。終了後、セッションを保存すると、AIが後続のコマンドを続行します。 - ヒントとコツ::
ライブビューのリンクをアプリに埋め込むことで、簡単にチームコラボレーションを行うことができます。
5.APIの統合
- 予備::
AirtopのSDK(TypeScriptとPythonに対応)を公式サイトからダウンロードする。Pythonをお使いの方は、例えば以下のように実行できます:
pip install airtop
その後、コード内でライブラリをインポートする:
from airtop import Airtop
- セッションの作成例::
コードでセッションを初期化する:client = Airtop(api_key="你的API密钥") session = client.create_session() session.command("打开 https://www.google.com")
- 抽出データの例::
APIを使用してWebページのデータを抽出します:data = session.extract("提取页面上的所有标题") print(data)
チップ
- APIキーの取得ログイン後、コントロールパネルの "設定 "からAPIキーを見つけ、コピーしてコード統合に使用します。
- ドキュメントを見るの公式ウェブサイト。
/docs
このページには詳細なAPIリファレンスとサンプルコードがあります。 - 資源の節約ブラウザを使い終わったら、クラウドのリソースの無駄遣いを防ぐため、忘れずに「セッションの終了」をクリックしてセッションを終了してください。
簡単なブラウジングから複雑な自動化タスクまで、これらのステップで簡単にAirtopを使い始めることができます。
アプリケーションシナリオ
- 市場調査
Airtopを使用して、Eコマースサイトから新製品情報を取得し、広告の邪魔を排除し、価格、モデル番号、その他のデータを抽出して、市場動向を簡単に分析できます。 - ソーシャルメディア・モニタリング
ソーシャル・プラットフォームにログインすると、特定のトピックに関する投稿やコメントが抽出され、ブランドがユーザーのフィードバックを理解するのに役立つ。 - 自動化されたオフィスワーク
自然言語コマンドを使用してオンラインフォームに入力したり、ドキュメントをダウンロードしたりすることで、日々の生産性が向上します。
品質保証
- Airtopはどのプログラミング言語をサポートしていますか?
現在、TypeScriptとPythonがサポートされており、今後さらに多くの言語のSDKが追加される予定だ。 - ブラウザを自作する必要があるのか?
Airtopはクラウド・ブラウザを提供しており、公式ウェブサイトやAPIから簡単にコントロールできる。 - CAPTCHAが表示された場合はどうすればよいですか?
ライブビュー機能で認証コードを手動で入力し、セッションを保存した後、AIは操作を続けることができる。