AI Personal Learning
und praktische Anleitung

Stagehand: Ein Framework für die Implementierung von Browser-Automatisierungsvorgängen in natürlicher Sprache

Allgemeine Einführung

Stagehand ist ein KI-Webbrowsing-Framework, das auf Einfachheit und Erweiterbarkeit ausgerichtet ist. Es ist vollständig Playwright-kompatibel und bietet drei einfache KI-APIs (act, extract und observe), die auf den zugrundeliegenden Playwright-Seitenklassen aufbauen und die Bausteine für die Web-Automatisierung über natürliche Sprache bereitstellen. Stagehand macht das Schreiben von dauerhaftem, effizientem Code für die Browser-Automatisierung einfacher, insbesondere für nicht-technische Benutzer, und reagiert weniger empfindlich auf kleine Änderungen im UI/DOM. Ob es darum geht, die Top-Storys des Tages auf Hacker News abzurufen oder Produkte auf Amazon zu suchen und zu kaufen, Stagehand macht es einfach. Das Framework befindet sich derzeit in einer frühen Version und das Entwicklerteam sucht aktiv nach Feedback aus der Community.

Stagehand: Ein Framework für die Implementierung von Browser-Automatisierung in natürlicher Sprache-1


 

Funktionsliste

  • Bietet drei einfache KI-APIs: Handeln, Extrahieren und Beobachten
  • Vollständig kompatibel mit Playwright
  • Unterstützung für Web-Automatisierung durch natürliche Sprache
  • Debugging-Tools wie Sitzungswiederholung und schrittweises Debugging bereitstellen
  • Für nichttechnische Benutzer
  • Unempfindlich gegenüber kleineren UI/DOM-Änderungen
  • Unterstützt die Integration mit Browserbase zur Bereitstellung leistungsfähigerer Debugging-Tools

 

Hilfe verwenden

Ablauf der Installation

  1. Klonen Sie das Stagehand-Projekt:
   git clone https://github.com/browserbase/stagehand.git
cd stagehand
  1. Installieren Sie die Abhängigkeit:
   npm installieren
npx playwright installieren
  1. Führen Sie das Beispielskript aus:
   npm Beispiel ausführen

Richtlinien für die Verwendung

Ein neues Projekt erstellen

Um ein mit Standardeinstellungen konfiguriertes Stagehand-Projekt zu erstellen, können Sie den folgenden Befehl ausführen:

npx create-browser-app --example quickstart

Weitere Informationen finden Sie in der Schnellstartanleitung.

Zu bestehendem Projekt hinzufügen

Sie können Stagehand mit dem folgenden Befehl zu einem bestehenden Typescript-Projekt hinzufügen:

npm installieren @browserbasehq/stagehand zod
npx playwright installieren

Konfigurieren des API-Schlüssels

Stagehand in seiner besten Form erfordert einen API-Schlüssel des LLM-Anbieters und Browserbase-Anmeldedaten. Um diese zu Ihrem Projekt hinzuzufügen, führen Sie aus:

cp .env.example .env
nano .env # .env-Datei bearbeiten, um API-Schlüssel hinzuzufügen

Hauptfunktionen

  1. act-APIWird verwendet, um Aktionen wie das Anklicken einer Schaltfläche, das Ausfüllen eines Formulars usw. durchzuführen.
   await page.act('Klicken Sie auf die Anmeldeschaltfläche');
  1. Extrakt-APIDient zum Extrahieren von Informationen, wie Text, Links usw., aus einer Seite.
   const headlines = await page.extract('Extract all news headlines');
  1. API beobachtenWird verwendet, um Seitenänderungen zu beobachten, z. B. Warten auf das Erscheinen von Elementen, Überwachung des Seitenladens usw.
   await page.observe('Warten auf das Ende des Ladevorgangs');

Tools zur Fehlersuche

Die Integration von Stagehand in Browserbase bietet leistungsstarke Debugging-Tools wie Sitzungswiederholung und schrittweises Debugging. Sie können diese Werkzeuge aktivieren, indem Sie die folgenden Schritte ausführen:

  1. Fügen Sie den Browserbase-API-Schlüssel zum Projekt hinzu:
   nano .env # hinzufügen BROWSERBASE_API_KEY und BROWSERBASE_PROJECT_ID
  1. Aktivieren Sie die Sitzungswiederholung:
   await page.enableSessionReplay();
  1. Aktivieren Sie das schrittweise Debugging:
   await page.enableStepByStepDebugging();

Wenn Sie diese Schritte befolgen, können Sie die Leistungsfähigkeit von Stagehand für eine effiziente Browser-Automatisierung voll ausschöpfen.

Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Stagehand: Ein Framework für die Implementierung von Browser-Automatisierungsvorgängen in natürlicher Sprache

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)