AI Personal Learning
und praktische Anleitung
豆包Marscode1

Stagehand: Ein Framework für die Implementierung von Browser-Automatisierungsvorgängen in natürlicher Sprache

Allgemeine Einführung

Stagehand ist ein KI-Webbrowsing-Framework, das auf Einfachheit und Erweiterbarkeit ausgerichtet ist. Es ist vollständig Playwright-kompatibel und bietet drei einfache KI-APIs (act, extract und observe), die auf den zugrundeliegenden Playwright-Seitenklassen aufbauen und die Bausteine für die Web-Automatisierung über natürliche Sprache bereitstellen. Stagehand macht das Schreiben von dauerhaftem, effizientem Code für die Browser-Automatisierung einfacher, insbesondere für nicht-technische Benutzer, und reagiert weniger empfindlich auf kleine Änderungen im UI/DOM. Ob es darum geht, die Top-Storys des Tages auf Hacker News abzurufen oder Produkte auf Amazon zu suchen und zu kaufen, Stagehand macht es einfach. Das Framework befindet sich derzeit in einer frühen Version und das Entwicklerteam sucht aktiv nach Feedback aus der Community.

Stagehand:自然语言实现浏览器自动化操作框架-1


 

Funktionsliste

  • Bietet drei einfache KI-APIs: Handeln, Extrahieren und Beobachten
  • Vollständig kompatibel mit Playwright
  • Unterstützung für Web-Automatisierung durch natürliche Sprache
  • Debugging-Tools wie Sitzungswiederholung und schrittweises Debugging bereitstellen
  • Für nichttechnische Benutzer
  • Unempfindlich gegenüber kleineren UI/DOM-Änderungen
  • Unterstützt die Integration mit Browserbase zur Bereitstellung leistungsfähigerer Debugging-Tools

 

Hilfe verwenden

Einbauverfahren

  1. Klonen Sie das Stagehand-Projekt:
   git clone https://github.com/browserbase/stagehand.git
cd stagehand
  1. Installieren Sie die Abhängigkeit:
   npm install
npx playwright install
  1. Führen Sie das Beispielskript aus:
   npm run example

Leitlinien für die Verwendung

Ein neues Projekt erstellen

Um ein mit Standardeinstellungen konfiguriertes Stagehand-Projekt zu erstellen, können Sie den folgenden Befehl ausführen:

npx create-browser-app --example quickstart

Weitere Informationen finden Sie in der Schnellstartanleitung.

Zu bestehendem Projekt hinzufügen

Sie können Stagehand mit dem folgenden Befehl zu einem bestehenden Typescript-Projekt hinzufügen:

npm install @browserbasehq/stagehand zod
npx playwright install

Konfigurieren des API-Schlüssels

Stagehand in seiner besten Form erfordert einen API-Schlüssel des LLM-Anbieters und Browserbase-Anmeldedaten. Um diese zu Ihrem Projekt hinzuzufügen, führen Sie aus:

cp .env.example .env
nano .env  # 编辑.env文件以添加API密钥

Hauptfunktionen

  1. act-APIWird verwendet, um Aktionen wie das Anklicken einer Schaltfläche, das Ausfüllen eines Formulars usw. durchzuführen.
   await page.act('点击登录按钮');
  1. Extrakt-APIDient zum Extrahieren von Informationen, wie Text, Links usw., aus einer Seite.
   const headlines = await page.extract('提取所有新闻标题');
  1. API beobachtenWird verwendet, um Seitenänderungen zu beobachten, z. B. Warten auf das Erscheinen von Elementen, Überwachung des Seitenladens usw.
   await page.observe('等待加载完成');

Tools zur Fehlersuche

Die Integration von Stagehand in Browserbase bietet leistungsstarke Debugging-Tools wie Sitzungswiederholung und schrittweises Debugging. Sie können diese Werkzeuge aktivieren, indem Sie die folgenden Schritte ausführen:

  1. Fügen Sie den Browserbase-API-Schlüssel zum Projekt hinzu:
   nano .env  # 添加BROWSERBASE_API_KEY和BROWSERBASE_PROJECT_ID
  1. Aktivieren Sie die Sitzungswiederholung:
   await page.enableSessionReplay();
  1. Aktivieren Sie das schrittweise Debugging:
   await page.enableStepByStepDebugging();

Wenn Sie diese Schritte befolgen, können Sie die Leistungsfähigkeit von Stagehand für eine effiziente Browser-Automatisierung voll ausschöpfen.

Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " Stagehand: Ein Framework für die Implementierung von Browser-Automatisierungsvorgängen in natürlicher Sprache
de_DEDeutsch