AI Personal Learning
und praktische Anleitung
豆包Marscode1

Airtop: ein Browser-Automatisierungstool mit natürlicher Sprachsteuerung

Allgemeine Einführung

Airtop ist ein KI-basiertes Browser-Automatisierungstool. Es ermöglicht Nutzern, ihren Cloud-Browser zu steuern, um komplexe Webvorgänge wie die Anmeldung bei einer Website, das Crawling von Daten oder die Durchführung automatisierter Aufgaben durch einfache Befehle in natürlicher Sprache durchzuführen. Es löst die Komplexität und Fehleranfälligkeit herkömmlicher Skripte und eignet sich besonders für Szenarien, in denen mehrere Authentifizierungen (wie OAuth oder doppelte Authentifizierung) erforderlich sind. Das Herzstück von Airtop ist seine Cloud-Browser-Technologie, die leicht auf mehrere Browser-Instanzen skaliert werden kann, um die Anforderungen umfangreicher Aufgaben zu erfüllen. Außerdem bietet sie menschliche Eingriffe in Echtzeit, so dass die Benutzer bei Bedarf die Arbeit übernehmen können. Kurz gesagt, Airtop macht mühsame Web-Automatisierung intuitiver und effizienter.

Airtop:使用自然语言控制的浏览器自动化工具-1


 

Funktionsliste

  • natürliche SprachsteuerungBenutzer können dem Browser in Alltagssprache Befehle erteilen, wie z. B. "sich auf einer Website anmelden" oder "Seitendaten abrufen".
  • Cloud-Browser-UnterstützungBietet einen skalierbaren, Cloud-basierten Browser für einzelne oder umfangreiche Operationen.
  • Komplexe AuthentifizierungsverfahrenUnterstützung für OAuth, doppelte Authentifizierung (2FA) und CAPTCHA-Auflösung für einfachen Zugang zu Websites, die eine Anmeldung erfordern.
  • Datenerfassung und -extraktionDie Fähigkeit, strukturierte Daten aus Webseiten zu extrahieren, wie z. B. Produktinformationen oder Suchergebnisse.
  • menschlicher Online-EingriffLive View: Ermöglicht es Benutzern, mit der Live View-Funktion jederzeit die Browser-Operationen zu übernehmen.
  • Unterstützung von DateimanipulationenUnterstützt grundlegende Funktionen wie das Hoch- und Herunterladen von Dateien sowie das Kopieren und Einfügen.
  • API-IntegrationSDKs für TypeScript und Python sind für Entwickler zur Integration in ihre Projekte verfügbar.

 

Hilfe verwenden

Airtop ist sehr einfach zu bedienen und erfordert keinen komplizierten Installationsprozess. Registrieren Sie sich einfach für ein Konto und greifen Sie über die offizielle Website darauf zu. Nachfolgend finden Sie eine ausführliche Beschreibung, wie Sie loslegen und die wichtigsten Funktionen nutzen können.

Wie man anfängt

  1. Registrieren & Anmelden
    Öffnen Sie https://www.airtop.ai/, klicken Sie auf die Schaltfläche "Anmelden" in der oberen rechten Ecke und geben Sie Ihre E-Mail-Adresse und Ihr Passwort ein, um Ihre Registrierung abzuschließen. Nach der Registrierung und dem Einloggen werden Sie zum Airtop-Kontrollfeld weitergeleitet.
  2. Erstellen einer Browser-Sitzung
    Klicken Sie nach dem Einloggen auf die Schaltfläche "Sitzung erstellen". Das System weist Ihnen automatisch einen Cloud-Browser zu. Sie können die Auflösung Ihres Browsers wählen (Standard ist menschliche Größe, z. B. 1920x1080).
  3. Verwendung von Befehlen in natürlicher Sprache
    Suchen Sie im Bedienfeld das Eingabefeld und geben Sie den Befehl direkt ein. Wenn Sie z. B. möchten, dass Ihr Browser Google öffnet, können Sie "Google Homepage öffnen" eingeben, und die KI von Airtop wird den Befehl analysieren und ausführen.

Hauptfunktionen

1. natürliche Sprachsteuerung

  • Verfahren::
    Geben Sie einen bestimmten Befehl in das Eingabefeld ein, z. B. "Suche nach den neuesten Nachrichten von Airtop". Der Browser öffnet automatisch eine Suchmaschine, gibt den Suchbegriff ein und zeigt die Ergebnisse an. Sie können auch "Klick auf den ersten Link auf der Seite" eingeben und die KI simuliert das menschliche Klickverhalten.
  • caveat::
    Die Befehle sollten so klar und spezifisch wie möglich sein und vage Aussagen vermeiden. Wenn ein Befehl nicht korrekt ausgeführt wird, können Sie den Status Ihres Browsers über die Live-Ansicht überprüfen.

2. die Handhabung der Authentifizierung

  • Verfahren::
    Wenn Sie sich bei der Ziel-Website anmelden müssen, geben Sie zunächst "Öffnen [Website-Adresse]" ein. Dann können Sie die Funktion "Live-Ansicht" verwenden (klicken Sie auf "Live-Ansicht-URL generieren", um einen Link zu generieren), um sich manuell anzumelden, indem Sie z. B. Ihr Kontopasswort eingeben oder einen QR-Code scannen. Klicken Sie nach der Anmeldung auf "Sitzungsprofil speichern", um den aktuellen Sitzungsstatus zu speichern. Danach können Sie die gespeicherte Sitzung verwenden, um direkt auf die eingeloggte Seite zuzugreifen, ohne dies erneut manuell tun zu müssen.
  • Gekennzeichnete Verwendung::
    Bei Websites, die eine doppelte Authentifizierung erfordern, können Sie in Live View einen Verifizierungscode in Echtzeit eingeben. Nach dem Speichern der Sitzung kann der KI-Agent mit Aktionen wie "Meine Bestellliste übernehmen" fortfahren.

3. die Datenerfassung und -extraktion

  • Verfahren::
    Angenommen, Sie möchten Produktinformationen von einer E-Commerce-Website erfassen, dann geben Sie zunächst ein: "Öffnen Sie [E-Commerce-Website] und suchen Sie nach Mobiltelefonen". Nachdem die Seite geladen ist, geben Sie "Extrahiere alle Produktnamen und Preise auf der Seite" ein. airtop gibt strukturierte Daten zurück (z. B. im JSON-Format), die Sie entweder direkt herunterladen oder über eine API abrufen können.
  • Erweiterte Verwendung::
    Wenn die Seite paginiert ist, können Sie "Klicken Sie auf die nächste Seite und fahren Sie mit der Datenextraktion fort" eingeben und Airtop blättert automatisch um und fasst alle Daten zusammen.

4. menschliches Eingreifen in Echtzeit

  • Verfahren::
    Wenn die KI-Operation auf ein Problem stößt, können Sie jederzeit auf die Schaltfläche "Live View" klicken, um einen Live-Link zu erzeugen. Sobald der Link geöffnet ist, können Sie die Kontrolle übernehmen, als ob Sie einen lokalen Browser bedienen würden, und komplexe Aufgaben wie das Lösen von CAPTCHA oder die Anpassung des Seitenlayouts manuell erledigen. Wenn Sie fertig sind, speichern Sie die Sitzung und die KI fährt mit den nachfolgenden Befehlen fort.
  • Tipps und Tricks::
    Live-View-Links können in Ihre App eingebettet werden, um die Zusammenarbeit im Team zu erleichtern.

5. die API-Integration

  • vorläufig::
    Laden Sie das SDK von Airtop (das TypeScript und Python unterstützt) von der offiziellen Website herunter. Python-Benutzer können es zum Beispiel ausführen:
pip install airtop

Dann importieren Sie die Bibliothek in den Code:

from airtop import Airtop
  • Beispiel für die Erstellung einer Sitzung::
    Initialisieren Sie die Sitzung mit Code:

    client = Airtop(api_key="你的API密钥")
    session = client.create_session()
    session.command("打开 https://www.google.com")
    
  • Beispiel für extrahierte Daten::
    Extrahieren von Webseitendaten über die API:

    data = session.extract("提取页面上的所有标题")
    print(data)
    

Tipp

  • Abrufen des API-SchlüsselsNach dem Einloggen finden Sie den API-Schlüssel unter "Einstellungen" im Kontrollpanel, kopieren ihn und verwenden ihn für die Code-Integration.
  • Dokument anzeigen: die offizielle Website der /docs Die Seite enthält eine detaillierte API-Referenz und Beispielcode.
  • Einsparungen bei den RessourcenWenn Sie die Nutzung des Browsers beendet haben, denken Sie daran, auf "Sitzung beenden" zu klicken, um die Sitzung zu schließen, damit keine Cloud-Ressourcen verschwendet werden.

Mit diesen Schritten können Sie ganz einfach mit Airtop beginnen, sei es für einfaches Browsing oder komplexe Automatisierungsaufgaben.

 

Anwendungsszenario

  1. Marktforschung
    Verwenden Sie Airtop, um neue Produktinformationen von E-Commerce-Websites zu erfassen, Werbeablenkungen zu beseitigen und Preis, Modellnummer und andere Daten zu extrahieren, um Markttrends einfach zu analysieren.
  2. Überwachung sozialer Medien
    Nach der Anmeldung bei sozialen Plattformen werden Beiträge und Kommentare zu bestimmten Themen extrahiert, damit Marken das Feedback der Nutzer besser verstehen können.
  3. automatisierte Büroarbeit
    Füllen Sie ein Online-Formular aus oder laden Sie ein Dokument herunter, indem Sie natürliche Sprachbefehle verwenden, um Ihre tägliche Produktivität zu steigern.

 

QA

  1. Welche Programmiersprachen werden von Airtop unterstützt?
    Derzeit werden TypeScript und Python unterstützt, und SDKs für weitere Sprachen werden später hinzugefügt.
  2. Muss ich meinen eigenen Browser entwickeln?
    Nein. Airtop bietet einen Cloud-Browser, den Sie einfach über die offizielle Website oder die API steuern können.
  3. Was sollte ich tun, wenn ich auf ein CAPTCHA stoße?
    Nach der manuellen Eingabe des Verifizierungscodes mit der Live-View-Funktion und dem Speichern der Sitzung kann die KI den Vorgang fortsetzen.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " Airtop: ein Browser-Automatisierungstool mit natürlicher Sprachsteuerung
de_DEDeutsch