AI Personal Learning
und praktische Anleitung

Stagehand:自然语言实现浏览器自动化操作框架

Allgemeine Einführung

Stagehand是一个专注于简洁性和可扩展性的AI网页浏览框架。它完全兼容Playwright,提供了三个简单的AI API(act、extract和observe),这些API构建在基础的Playwright Page类之上,为通过自然语言进行网页自动化提供了基础模块。Stagehand使得编写持久、高效的浏览器自动化代码变得更加容易,尤其适合非技术用户,并且对UI/DOM的微小变化不那么敏感。无论是在Hacker News上提取当天的热门故事,还是在亚马逊上搜索并购买产品,Stagehand都能轻松实现。该框架目前处于早期发布阶段,开发团队积极寻求社区反馈。

Stagehand:自然语言实现浏览器自动化操作框架-1


 

Funktionsliste

  • 提供三个简单的AI API:act、extract和observe
  • 完全兼容Playwright
  • 支持通过自然语言进行网页自动化
  • 提供会话重放和逐步调试等调试工具
  • 适用于非技术用户
  • 对UI/DOM的微小变化不敏感
  • 支持与Browserbase集成,提供更强大的调试工具

 

Hilfe verwenden

Ablauf der Installation

  1. 克隆Stagehand项目:
   git clone https://github.com/browserbase/stagehand.git
cd stagehand
  1. Installieren Sie die Abhängigkeit:
   npm install
npx playwright install
  1. 运行示例脚本:
   npm run example

Richtlinien für die Verwendung

Ein neues Projekt erstellen

要创建一个配置为默认设置的Stagehand项目,可以运行以下命令:

npx create-browser-app --example quickstart

详细信息请参阅快速入门指南。

添加到现有项目

您可以通过以下命令将Stagehand添加到现有的Typescript项目中:

npm install @browserbasehq/stagehand zod
npx playwright install

Konfigurieren des API-Schlüssels

Stagehand在最佳状态下需要一个LLM提供者的API密钥和Browserbase凭证。要将这些添加到您的项目中,请运行:

cp .env.example .env
nano .env  # 编辑.env文件以添加API密钥

Hauptfunktionen

  1. act API:用于执行操作,例如点击按钮、填写表单等。
   await page.act('点击登录按钮');
  1. extract API:用于提取信息,例如从页面中提取文本、链接等。
   const headlines = await page.extract('提取所有新闻标题');
  1. observe API:用于观察页面变化,例如等待元素出现、监控页面加载等。
   await page.observe('等待加载完成');

Tools zur Fehlersuche

Stagehand与Browserbase集成后,提供了强大的调试工具,如会话重放和逐步调试。您可以通过以下步骤启用这些工具:

  1. 在项目中添加Browserbase API密钥:
   nano .env  # 添加BROWSERBASE_API_KEY和BROWSERBASE_PROJECT_ID
  1. 启用会话重放:
   await page.enableSessionReplay();
  1. 启用逐步调试:
   await page.enableStepByStepDebugging();

通过以上步骤,您可以充分利用Stagehand的强大功能,实现高效的浏览器自动化。

Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Stagehand:自然语言实现浏览器自动化操作框架

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)