Mit Browse AI können Sie innerhalb von Minuten ohne Code Daten von jeder beliebigen Webseite extrahieren und überwachen. Die Bots, die Sie so trainieren, dass sie Webseiten genau wie Menschen bedienen, ermöglichen es Ihnen, die genauesten Daten mit dem geringsten Aufwand zu extrahieren. In diesem Leitfaden werden einige wichtige Konzepte vorgestellt, die Ihnen den Einstieg erleichtern.
1) Robotik
Sie können eineMechanikerinum eine Reihe von Schritten auf Ihrer Website zu automatisieren, die Sie normalerweise manuell durchführen würden.
Ein Roboter kann zum Beispiel alle folgenden Verhaltensweisen ausführen, während er eine Aufgabe erfüllt:
- eine Webseite öffnen
- Landung (eines Taifuns usw.)
- auf eine Schaltfläche klicken
- ein Formular ausfüllen
- Wählen Sie aus dem Dropdown-Menü
- Extrahieren strukturierter Daten aus Webseiten in Tabellenkalkulationen
- Klicken Sie auf die Schaltfläche "Weiter" oder "Mehr laden", um weitere Daten zu erhalten.
- ein auf einem Computerbildschirm angezeigtes Bild aufnehmen
- Überwachung visueller oder inhaltlicher Änderungen an bestimmten Teilen einer Webseite
Der Bot verfügt über dynamische [Eingabeparameter], die es Ihnen ermöglichen, die URL der Webseite alias [Quell-URL] oder die Texteingabe bei jedem Durchlauf anzupassen. So können Sie denselben Bot verwenden, um Daten auf einer unbegrenzten Anzahl von Seiten einer Website mit ähnlichem Layout zu extrahieren oder zu überwachen.
Die meisten Leute erstellen Roboter, die einfach eine Webseite öffnen und Daten daraus extrahieren. Benutzer können [Batch-Lauf] für Zehntausende ähnlicher Seiten auf einer Website verwenden, um schnell den gesamten Datensatz zu extrahieren.
Bots erledigen auch viele Dinge im Hintergrund, die Sie vielleicht gar nicht bemerken, wie z. B. das Lösen von CAPTCHAs, die Verwendung von geografisch verorteten IP-Adressen, die Nachahmung menschlichen Verhaltens, um nicht entdeckt zu werden, die automatische Anpassung an Website-Änderungen und im Wesentlichen die Selbstwartung.
2) Vorgefertigte Roboter im Vergleich zu kundenspezifischen Robotern
Roboter können mit [Vorgefertigter Roboter] oder mit dem KI-Rekorder "Durchsuchen" und seiner Click-to-Extract-Schnittstelle erstellt werden. Jeder Roboter hat einige [Eingabeparameter] (z. B. die Webadresse), die Sie bei jedem Start anpassen können.
Vorgefertigte Bots eignen sich für gängige Anwendungsfälle, und jede Woche werden neue Bots veröffentlicht. Beispiele sind die Extraktion von Daten aus den Unternehmenswebseiten von Yelp, TripAdvisor oder LinkedIn.
Mehr als 901 TP3T of Browse AI-Nutzer erstellen Bots, die für bestimmte Anwendungsfälle trainiert wurden. Einige Immobilienmakler überwachen zum Beispiel die Baugenehmigungen, die von ihrer Bezirksregierung (auf der offiziellen Website des Bezirks) erteilt werden, und verknüpfen sie mit einem CRM oder einer Tabelle, die automatisch eine E-Mail an jeden Bauunternehmer sendet, der eine Baugenehmigung erhalten hat.
3) Quell-URL
Jeder [benutzerdefinierte Bot] hat eine Quell-URL [Eingabeparameter], die standardmäßig auf den Link verweist, für den er trainiert wurde. Sie können Daten von jeder anderen Seite auf dieser Website mit einem ähnlichen Layout extrahieren oder überwachen, indem Sie die Quell-URL ändern.
Wenn Sie beispielsweise die Produktpreise von Walmart [überwachen] möchten, können Sie einen benutzerdefinierten Bot auf einer Walmart-Produktseite trainieren und dann die Quell-URL für jede Überwachung anpassen, um den Bot für die Überwachung von 100 verschiedenen Produktseiten zu konfigurieren.
4) Aufgaben
Jeder [Bot] ist für die Ausführung einer bestimmten Aufgabe trainiert. Jedes Mal, wenn Sie den Bot starten, führt er diese Aufgabe aus, und die Details der Aufgabe (einschließlich der extrahierten Daten) werden unter dieser Aufgabe auf der Registerkarte "Verlauf" des Bots gespeichert.
Wenn Sie einen Überwachungs-Bot einrichten, der täglich Änderungen an Webseiten [überwacht], muss er möglicherweise eine Aufgabe pro Tag oder etwa 30 Aufgaben pro Monat ausführen.
Neue Aufgaben können auf verschiedene Weise erstellt werden:
- Sie können einen Bot auf Ihrem Dashboard öffnen, auf die Registerkarte Aufgaben ausführen gehen und eine Aufgabe ausführen.
- Auf der Registerkarte Aufgaben ausführen können Sie auch [Stapelverarbeitung] wählen, um bis zu 50.000 Aufgaben auf einmal auszuführen, indem Sie CSV-Dateien hochladen.
- Wenn Sie einen Monitor konfigurieren, wird automatisch eine neue Überwachungsaufgabe erstellt, sobald Sie eine Überwachungsprüfung durchführen müssen.
- Wenn Sie Browse AI in eine andere Software integrieren oder die API verwenden, können neue Aufgaben über die API erstellt werden.
- Gelegentlich erstellt das System Aufgaben, um sicherzustellen, dass der Roboter gesund ist, oder um den Roboter zu optimieren, damit er schneller oder zuverlässiger wird. Die Aufgaben werden als "vom System ausgeführt" markiert.
5) Überwachen
Eine der nützlichsten Funktionen von Browse AI ist das integrierte Überwachungssystem.
Jeder Roboter kann mit einer unendlichen Anzahl von Monitoren konfiguriert werden, von denen jeder einer Seite der Website oder einer Suchbedingung entspricht, die überwacht werden muss.
Sie könnten zum Beispiel einen Bot verwenden, um alle Produkte auf einer E-Commerce-Website zu überwachen und Benachrichtigungen zu erhalten, wenn sich die Preise ändern oder ein Produkt verfügbar wird.
Der Monitor kann Änderungen erkennen und kann so konfiguriert werden, dass er eine E-Mail-Benachrichtigung sendet, wenn eine Änderung erkannt wird, oder die Daten automatisch an eine andere Software sendet.
6) Eingabeparameter
Jeder Bot ist mit Eingabeparametern ausgestattet, die je nach Aufgabenstellung angepasst und überwacht werden können, so dass Sie nicht für jede Seite oder jeden Suchbegriff auf Ihrer Website neue Bots erstellen müssen.
Der häufigste Eingabeparameter ist [Quell-URL], d. h. die Seite, die der Roboter zum ersten Mal besucht.
Wenn Sie beim Anpassen Ihres Roboters einen Text eingeben, wird dieser zu einem Eingabeparameter, der später angepasst werden kann.
7) Stapelverarbeitung
Die Funktion "Stapelverarbeitung" ist auf der Registerkarte "Aufgaben ausführen" des Roboterbedienfelds verfügbar. Mit dieser Funktion können Sie eine CSV-Datei mit bis zu 50.000 verschiedenen Sätzen von [Eingabeparametern] hochladen und sofort eine [Aufgabe] für jeden Satz von Parametern erstellen. Die Aufgaben werden zur Verarbeitung in eine Warteschlange gestellt, und nach Abschluss erhalten Sie den vollständigen extrahierten Datensatz.
Sie können zum Beispiel eine CSV-Datei mit Links zu 50.000 Unternehmensseiten auf LinkedIn hochladen und alle Daten von diesen Seiten extrahieren lassen.
8) Tiefes Kriechen
Deep Crawl ist ein häufig verwendeter Begriff, der sich auf das Crawlen einer Liste von Links von einer Seite in einer bestimmten Kategorie und das anschließende Extrahieren der Details der einzelnen Links bezieht.
Dieser Ansatz ermöglicht es Ihnen, detaillierte Daten von Seiten oder Abschnitten Ihrer Website zu sammeln.
Erfahren Sie mehr über die Verwendung von AI durchsuchen Führen Sie einen Deep Crawl von [verwandter Artikel] durch.
9) Integrierte Anwendungen
Oft müssen Sie Daten, die Sie auf Ihrer Website erfasst haben, in andere Software übertragen, die Sie verwenden, z. B. Google Forms oder CRM. Browse AI bietet über 5.000 Integrationen, die es Ihnen leicht machen, Daten von jeder Website in die Tools zu importieren, die Sie bereits verwenden.
10) Google Forms Integration mit Airtable
Es gibt bereits direkte Integrationen für [Google Forms] und Airtable. Nach der Konfiguration des Roboters werden die extrahierten Daten jedes Mal, wenn der Roboter eine Aufgabe ausführt, direkt in Ihre Tabellenkalkulation eingefügt.
AI's Google Forms Plugin durchsuchen
Dieses Plugin bietet zusätzliche Funktionen für Google Forms:
- Der Roboter kann direkt in Google Forms ausgeführt werden, indem der Satz von Eingabeparametern markiert und die Schaltfläche angeklickt wird.
- Automatisches Löschen von alten Daten aus Google Forms.
- Automatisches Entfernen von Duplikaten aus Google Sheets.
11) Integration von Anschlüssen (Zapier, Make, Pabbly)
Mit ein paar Klicks in der Integrationssoftware von Drittanbietern können Sie mit diesen nativen Integrationsmethoden Browse AI mit über 5000 anderen Apps verbinden:
- [ZapierEinfach zu bedienen, aber kostspielig, wenn es in großen Mengen verwendet wird.
- [Machen Sie] kostet weniger, ist aber komplizierter in der Anwendung.
- [Pabbly Connect] Wird häufig von Nutzern verwendet, die einen einmaligen, kostenpflichtigen Vertrag auf Lebenszeit abgeschlossen haben, um Geld zu sparen.
12) API und Webhooks
Wenn Sie Softwareentwickler in Ihrem Team haben, sollten Sie die Vorteile von APIs und Webhooks nutzen, mit denen Sie fast alles über das Control Panel machen können (außer neue Bots zu erstellen) und eine programmatische Schnittstelle zu öffentlich verfügbaren APIs und Webhooks haben.
Einige Start-ups haben ihre Software auf der Grundlage der APIs von Browse AI entwickelt und das gesamte arbeitsintensive Crawling der Daten ausgelagert.