Allgemeine Einführung
Stagehand ist ein KI-Webbrowsing-Framework, das auf Einfachheit und Erweiterbarkeit ausgerichtet ist. Es ist vollständig Playwright-kompatibel und bietet drei einfache KI-APIs (act, extract und observe), die auf den zugrundeliegenden Playwright-Seitenklassen aufbauen und die Bausteine für die Web-Automatisierung über natürliche Sprache bereitstellen. Stagehand macht das Schreiben von dauerhaftem, effizientem Code für die Browser-Automatisierung einfacher, insbesondere für nicht-technische Benutzer, und reagiert weniger empfindlich auf kleine Änderungen im UI/DOM. Ob es darum geht, die Top-Storys des Tages auf Hacker News abzurufen oder Produkte auf Amazon zu suchen und zu kaufen, Stagehand macht es einfach. Das Framework befindet sich derzeit in einer frühen Version und das Entwicklerteam sucht aktiv nach Feedback aus der Community.
Funktionsliste
- Bietet drei einfache KI-APIs: Handeln, Extrahieren und Beobachten
- Vollständig kompatibel mit Playwright
- Unterstützung für Web-Automatisierung durch natürliche Sprache
- Debugging-Tools wie Sitzungswiederholung und schrittweises Debugging bereitstellen
- Für nichttechnische Benutzer
- Unempfindlich gegenüber kleineren UI/DOM-Änderungen
- Unterstützt die Integration mit Browserbase zur Bereitstellung leistungsfähigerer Debugging-Tools
Hilfe verwenden
Ablauf der Installation
- Klonen Sie das Stagehand-Projekt:
git clone https://github.com/browserbase/stagehand.git
cd stagehand
- Installieren Sie die Abhängigkeit:
npm installieren
npx playwright installieren
- Führen Sie das Beispielskript aus:
npm Beispiel ausführen
Richtlinien für die Verwendung
Ein neues Projekt erstellen
Um ein mit Standardeinstellungen konfiguriertes Stagehand-Projekt zu erstellen, können Sie den folgenden Befehl ausführen:
npx create-browser-app --example quickstart
Weitere Informationen finden Sie in der Schnellstartanleitung.
Zu bestehendem Projekt hinzufügen
Sie können Stagehand mit dem folgenden Befehl zu einem bestehenden Typescript-Projekt hinzufügen:
npm installieren @browserbasehq/stagehand zod
npx playwright installieren
Konfigurieren des API-Schlüssels
Stagehand in seiner besten Form erfordert einen API-Schlüssel des LLM-Anbieters und Browserbase-Anmeldedaten. Um diese zu Ihrem Projekt hinzuzufügen, führen Sie aus:
cp .env.example .env
nano .env # .env-Datei bearbeiten, um API-Schlüssel hinzuzufügen
Hauptfunktionen
- act-APIWird verwendet, um Aktionen wie das Anklicken einer Schaltfläche, das Ausfüllen eines Formulars usw. durchzuführen.
await page.act('Klicken Sie auf die Anmeldeschaltfläche');
- Extrakt-APIDient zum Extrahieren von Informationen, wie Text, Links usw., aus einer Seite.
const headlines = await page.extract('Extract all news headlines');
- API beobachtenWird verwendet, um Seitenänderungen zu beobachten, z. B. Warten auf das Erscheinen von Elementen, Überwachung des Seitenladens usw.
await page.observe('Warten auf das Ende des Ladevorgangs');
Tools zur Fehlersuche
Die Integration von Stagehand in Browserbase bietet leistungsstarke Debugging-Tools wie Sitzungswiederholung und schrittweises Debugging. Sie können diese Werkzeuge aktivieren, indem Sie die folgenden Schritte ausführen:
- Fügen Sie den Browserbase-API-Schlüssel zum Projekt hinzu:
nano .env # hinzufügen BROWSERBASE_API_KEY und BROWSERBASE_PROJECT_ID
- Aktivieren Sie die Sitzungswiederholung:
await page.enableSessionReplay();
- Aktivieren Sie das schrittweise Debugging:
await page.enableStepByStepDebugging();
Wenn Sie diese Schritte befolgen, können Sie die Leistungsfähigkeit von Stagehand für eine effiziente Browser-Automatisierung voll ausschöpfen.