12 ключевых понятий, которые следует знать об использовании искусственного интеллекта в браузере

Просмотреть ИИ позволяет извлекать и отслеживать данные с любой веб-страницы за считанные минуты без использования кода. Боты, которых вы обучите управлять веб-сайтами так же, как это делают люди, позволят вам извлекать самые точные данные с наименьшими усилиями. В этом руководстве представлены некоторые ключевые понятия, которые помогут вам начать работу.

 

 

1) Робототехника

 

Вы можете обучитьмеханикавтоматизировать ряд действий на вашем сайте, которые обычно приходится выполнять вручную.

Например, робот может выполнять все следующие действия во время выполнения задания:

  • Откройте страницу
  • выходить на сушу (о тайфуне и т.п.)
  • нажать на кнопку
  • заполнить форму
  • Выберите из выпадающего меню
  • Извлечение структурированных данных с веб-страниц в электронные таблицы
  • Нажмите на кнопку "Далее" или "Загрузить больше", чтобы получить больше данных.
  • захват изображения, отображаемого на экране компьютера
  • Отслеживайте визуальные или содержательные изменения в определенных частях веб-страницы

 

Бот имеет динамические [входные параметры], которые позволяют настраивать URL веб-страницы как [исходный URL] или текстовый ввод при каждом запуске. Это позволяет использовать одного и того же бота для извлечения или мониторинга данных на неограниченном количестве страниц сайта со схожим макетом.

 

Большинство людей создают роботов, которые просто открывают веб-страницу и извлекают из нее данные. Пользователи могут использовать [пакетный запуск] для десятков тысяч похожих страниц на сайте, чтобы быстро извлечь весь набор данных.

 

Боты также делают много вещей в фоновом режиме, которые вы можете не заметить, например, решают CAPTCHA, используют географически привязанные IP-адреса, имитируют поведение человека, чтобы избежать обнаружения, автоматически адаптируются к изменениям на сайте и, по сути, занимаются самообслуживанием.

 

 

2) Готовые роботы в сравнении с роботами, изготовленными на заказ

 

Роботы могут быть созданы с помощью [Готового робота] или с помощью рекордера Browse AI и его интерфейса с возможностью извлечения по клику. Каждый робот имеет некоторые [Входные параметры] (например, веб-адрес), которые вы можете настраивать каждый раз, когда запускаете его.

Готовые боты применяются к популярным сценариям использования, и каждую неделю появляются новые. В качестве примера можно привести извлечение данных с сайтов компаний Yelp, TripAdvisor или LinkedIn.

 

Более 901 пользователя TP3T of Browse AI создают ботов, обученных для конкретных случаев использования. Например, некоторые риелторы отслеживают [watch] разрешения на строительство, выданные правительством их округа (на официальном сайте округа), и подключают его к CRM или таблице продаж, которая автоматически рассылает электронные письма каждому строителю, получившему разрешение на строительство.

 

 

3) URL-адрес источника

 

У каждого [пользовательского бота] есть исходный URL [входной параметр], который по умолчанию указывает на ссылку, на которой он обучался. Вы можете извлекать или отслеживать данные с любой другой страницы сайта с аналогичным расположением, изменив исходный URL.

 

Например, если вы хотите [отслеживать] цены на товары Walmart, вы можете обучить пользовательского бота на странице товара Walmart, а затем настроить URL-адрес источника для каждого монитора, чтобы настроить бота на отслеживание 100 различных страниц товара.

 

 

4) Задачи

 

Каждый [бот] обучен выполнять определенную задачу. Каждый раз, когда вы запускаете бота, он выполняет эту задачу, а детали задачи (включая извлеченные данные) хранятся под этой задачей на вкладке "История" бота.

 

Если вы настроили бота для ежедневного [мониторинга] изменений веб-страниц, ему может потребоваться выполнение одной задачи в день или около 30 задач в месяц.

 

Новые задания можно создавать несколькими способами:

  • Вы можете открыть бота на панели управления, перейти на вкладку "Выполнение задач" и запустить задание.
  • На вкладке "Выполнение заданий" можно также выбрать [Пакетный запуск] для одновременного выполнения до 50 000 заданий путем загрузки файлов CSV.
  • Если вы настроили монитор, новое задание мониторинга будет автоматически создаваться каждый раз, когда вам нужно будет выполнить проверку мониторинга.
  • Если вы интегрируете Browse AI с другим программным обеспечением или используете API, новые задачи можно создавать через API.
  • Время от времени система будет создавать задания, чтобы убедиться, что робот здоров, или оптимизировать его, чтобы сделать быстрее или надежнее. Задания будут помечены как "выполняемые системой".

 

 

5) Монитор

 

Одна из самых полезных функций Browse AI - встроенная система мониторинга.

Каждый робот может иметь бесконечное количество мониторов, каждый из которых соответствует странице на сайте или условию поиска, которое необходимо отслеживать.

Например, вы можете использовать бота для мониторинга всех товаров на сайте электронной коммерции и получать уведомления об изменении цен или появлении товара в продаже.

Монитор может обнаруживать изменения и может быть настроен на отправку уведомления по электронной почте при обнаружении изменений или автоматическую отправку данных в другое программное обеспечение.

 

 

6) Входные параметры

 

Каждый бот оснащен входными параметрами, которые можно настраивать и отслеживать в соответствии с требованиями задачи, что означает, что вам не нужно создавать ботов для каждой страницы или поискового запроса на вашем сайте.

 

Наиболее распространенным входным параметром является [исходный URL] - это страница, которую робот посещает в первый раз.

При настройке робота, если вы введете какой-либо текст, он станет входным параметром, который впоследствии можно будет настроить.

 

 

7) Пакетное выполнение

 

Функция пакетного выполнения доступна на вкладке "Выполнение заданий" панели управления робота. Эта функция позволяет загрузить CSV-файл, содержащий до 50 000 различных наборов [Входные параметры], и сразу же создать [Задание] для каждого набора параметров. Задания будут поставлены в очередь на обработку, и по ее завершении вам будет предоставлен полный набор извлеченных данных.

 

Например, вы можете загрузить CSV-файл, содержащий ссылки на 50 000 страниц компаний в LinkedIn, и получить все данные, извлеченные из этих страниц.

 

 

8) Глубокая ползучесть

 

Deep Crawl - это общеупотребительный термин, который обозначает сбор списка ссылок со страницы в определенной категории и последующее извлечение подробной информации о каждой ссылке.

 

Такой подход позволяет собирать глубокие и подробные данные со страниц или разделов вашего сайта.

 

Узнайте больше об использовании Обзор ИИ Выполните глубокий просмотр [связанной статьи].

 

 

9) Интегрированные приложения

 

Часто вам нужно перенести данные, полученные на вашем сайте, в другое программное обеспечение, которое вы используете, например в Google Forms или CRM. Browse AI предлагает более 5 000 интеграций, чтобы облегчить импорт данных с любого сайта в уже используемые инструменты.

 

 

10) Интеграция Google Forms с Airtable

 

Уже существуют прямые интеграции для [Google Forms] и Airtable. После настройки робота каждый раз, когда он выполняет задание, извлеченные данные вставляются прямо в вашу электронную таблицу.

 

 

Обзор плагина AI для Google Forms

Этот плагин предоставляет дополнительную функциональность для Google Forms:

  • Робота можно запустить прямо в Google Forms, выделив набор входных параметров и нажав кнопку.
  • Автоматическое удаление старых данных из Google Forms.
  • Автоматическое удаление дубликатов из Google Sheets.

 

 

11) Интеграция коннекторов (Zapier, Make, Pabbly)

 

С помощью нескольких кликов на сторонних программах интеграции, эти встроенные методы интеграции позволят вам соединить Browse AI с 5000+ другими приложениями:

  • [Zapier] Простой в эксплуатации, но дорогостоящий при использовании в больших количествах.
  • [Сделать] стоит дешевле, но сложнее в использовании.
  • [Pabbly Connect] Часто используется пользователями, которые приобрели одноразовое платное пожизненное соглашение, чтобы сэкономить деньги.

 

 

12) API и Webhooks

 

Если в вашей команде есть разработчики программного обеспечения, обязательно воспользуйтесь API и веб-крючками, которые позволяют делать практически все в панели управления (кроме создания новых ботов) и программно взаимодействовать с общедоступными API и веб-крючками.

Некоторые стартапы создали свое программное обеспечение на основе API Browse AI и передали на аутсорсинг всю трудоемкую работу по сбору данных.

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...