Browse AI 사용에 대해 알아야 할 12가지 핵심 개념

찾아보기 AI를 사용하면 코드 없이도 몇 분 만에 모든 웹 페이지에서 데이터를 추출하고 모니터링할 수 있습니다. 사람처럼 웹사이트를 운영하도록 훈련시킨 봇을 사용하면 최소한의 노력으로 가장 정확한 데이터를 추출할 수 있습니다. 이 가이드에서는 시작하는 데 도움이 되는 몇 가지 주요 개념을 소개합니다.

 

 

1) 로봇 공학

 

교육할 수 있습니다.기계적인 사람를 사용하여 웹사이트에서 일반적으로 수동으로 수행하던 일련의 단계를 자동화할 수 있습니다.

예를 들어 로봇은 작업을 수행하는 동안 다음 동작을 모두 수행할 수 있습니다:

  • 웹 페이지 열기
  • (태풍 등) 상륙하기
  • 버튼을 클릭합니다.
  • 양식을 작성하세요.
  • 드롭다운 메뉴에서 선택
  • 웹 페이지에서 스프레드시트로 구조화된 데이터 추출하기
  • 더 많은 데이터를 보려면 '다음' 또는 '더 로드' 버튼을 클릭합니다.
  • 컴퓨터 화면에 표시되는 이미지 캡처
  • 웹 페이지의 특정 부분에 대한 시각적 또는 콘텐츠 변경 사항 모니터링

 

봇에는 동적 [입력 매개변수]가 있어 실행할 때마다 웹 페이지의 URL(일명 [소스 URL]) 또는 텍스트 입력을 조정할 수 있습니다. 이를 통해 동일한 봇을 사용하여 비슷한 레이아웃을 가진 사이트의 페이지 수에 제한 없이 데이터를 추출하거나 모니터링할 수 있습니다.

 

대부분의 사람들은 단순히 웹 페이지를 열고 거기서 데이터를 추출하는 로봇을 만듭니다. 사용자는 웹사이트의 수만 개의 유사한 페이지에서 [일괄 실행]을 사용하여 전체 데이터 집합을 빠르게 추출할 수 있습니다.

 

봇은 또한 캡차 해결, 지리적 위치의 거주지 IP 주소 사용, 탐지를 피하기 위한 인간 행동 모방, 웹사이트 변경 사항에 대한 자동 적응, 기본적으로 자체 유지 관리 등 사용자가 알아차리지 못할 수 있는 많은 일을 백그라운드에서 수행합니다.

 

 

2) 조립식 로봇 대 맞춤형 로봇

 

로봇은 [미리 만들어진 로봇]을 사용하거나 AI 레코더 찾아보기 및 클릭 투 추출 인터페이스를 사용하여 만들 수 있습니다. 각 로봇에는 실행할 때마다 조정할 수 있는 몇 가지 [입력 매개변수](예: 웹 주소)가 있습니다.

사전 구축된 봇은 인기 있는 사용 사례에 적용되며 매주 새로운 봇이 출시됩니다. 예를 들어 Yelp, 트립어드바이저 또는 LinkedIn 회사 웹사이트에서 데이터를 추출하는 것이 있습니다.

 

901 TP3T 이상의 Browse AI 사용자가 특정 사용 사례에 맞게 학습된 맞춤형 봇을 만듭니다. 예를 들어, 일부 부동산업자는 카운티 정부(카운티 공식 웹사이트)에서 발급한 건축 허가를 모니터링[보기]하고 이를 영업 CRM 또는 스프레드시트에 연결하여 건축 허가를 받은 모든 건축업자에게 자동으로 이메일을 발송합니다.

 

 

3) 소스 URL

 

각 [사용자 지정 봇]에는 기본적으로 학습된 링크를 가리키는 소스 URL[입력 매개변수]가 있습니다. 소스 URL을 조정하여 비슷한 레이아웃을 가진 해당 사이트의 다른 페이지에서 데이터를 추출하거나 모니터링할 수 있습니다.

 

예를 들어 Walmart의 제품 가격을 [모니터링]하려는 경우 Walmart 제품 페이지에서 사용자 지정 봇을 학습시킨 다음 각 모니터의 소스 URL을 조정하여 100개의 다른 제품 페이지를 모니터링하도록 해당 봇을 구성할 수 있습니다.

 

 

4) 작업

 

각 [봇]은 특정 작업을 수행하도록 학습됩니다. 해당 봇을 실행할 때마다 해당 작업을 수행하며, 작업의 세부 정보(추출된 데이터 포함)는 봇의 기록 탭에 있는 해당 작업 아래에 저장됩니다.

 

웹 페이지 변경 사항을 매일 [모니터링]하도록 모니터링 봇을 설정하는 경우 하루에 하나의 작업 또는 한 달에 약 30개의 작업을 실행해야 할 수 있습니다.

 

새 작업은 여러 가지 방법으로 만들 수 있습니다:

  • 대시보드에서 봇을 열고 작업 실행 탭으로 이동하여 작업을 실행할 수 있습니다.
  • 작업 실행 탭에서 [일괄 실행]을 선택하면 CSV 파일을 업로드하여 한 번에 최대 50,000개의 작업을 실행할 수도 있습니다.
  • 모니터를 구성하면 모니터링 확인을 수행해야 할 때마다 새 모니터링 작업이 자동으로 만들어집니다.
  • Browse AI를 다른 소프트웨어와 통합하거나 API를 사용하는 경우, API를 통해 새 작업을 만들 수 있습니다.
  • 때때로 시스템은 로봇의 상태를 확인하거나 로봇을 최적화하여 더 빠르고 안정적으로 만들기 위해 작업을 생성합니다. 작업은 "시스템에서 실행됨"으로 표시됩니다.

 

 

5) 모니터

 

Browse AI의 가장 유용한 기능 중 하나는 내장된 모니터링 시스템입니다.

각 로봇은 모니터링해야 하는 웹사이트의 페이지 또는 검색 조건에 해당하는 모니터를 무한대로 구성할 수 있습니다.

예를 들어 봇을 사용하여 이커머스 사이트의 모든 제품을 모니터링하고 가격이 변경되거나 제품이 출시되면 알림을 받을 수 있습니다.

모니터는 변경 사항을 감지할 수 있으며, 변경 사항이 감지되면 이메일 알림을 보내거나 다른 소프트웨어로 데이터를 자동으로 전송하도록 구성할 수 있습니다.

 

 

6) 입력 매개변수

 

각 봇에는 작업 요구 사항에 따라 조정 및 모니터링할 수 있는 입력 매개변수가 탑재되어 있으므로 웹사이트의 모든 페이지나 검색어에 대해 봇을 다시 만들 필요가 없습니다.

 

가장 일반적인 입력 매개변수는 로봇이 처음 방문하는 페이지인 [소스 URL]입니다.

로봇을 사용자 지정할 때 텍스트를 입력하면 입력한 내용이 나중에 조정할 수 있는 입력 파라미터가 됩니다.

 

 

7) 일괄 실행

 

일괄 실행 기능은 로봇 제어판의 작업 실행 탭에서 사용할 수 있습니다. 이 기능을 사용하면 최대 50,000개의 서로 다른 [입력 매개변수] 세트가 포함된 CSV 파일을 업로드하고 각 매개변수 세트에 대한 [작업]을 즉시 생성할 수 있습니다. 작업은 처리를 위해 대기열에 대기되며 완료되면 추출된 전체 데이터 세트가 제공됩니다.

 

예를 들어 LinkedIn에 50,000개의 회사 페이지 링크가 포함된 CSV 파일을 업로드하고 해당 페이지에서 추출된 모든 데이터를 가져올 수 있습니다.

 

 

8) 딥 크롤링

 

딥 크롤링은 특정 카테고리의 페이지에서 링크 목록을 크롤링한 다음 각 링크의 세부 정보를 추가로 추출하는 것을 가리키는 일반적으로 사용되는 용어입니다.

 

이 접근 방식을 사용하면 웹사이트 내 페이지 또는 섹션에서 심층적이고 상세한 데이터를 수집할 수 있습니다.

 

사용 방법에 대해 자세히 알아보기 AI 찾아보기 관련 문서]의 딥 크롤링을 수행합니다.

 

 

9) 통합 애플리케이션

 

웹 사이트에서 캡처한 데이터를 Google 양식이나 CRM 등 사용하는 다른 소프트웨어로 전송해야 하는 경우가 종종 있는데, Browse AI는 5,000개 이상의 통합 기능을 제공하여 어떤 웹사이트의 데이터라도 이미 사용 중인 도구로 쉽게 가져올 수 있도록 지원합니다.

 

 

10) 에어테이블과 구글 폼 통합

 

이미 [Google 설문지]와 Airtable이 직접 통합되어 있습니다. 로봇에 구성이 완료되면 로봇이 작업을 수행할 때마다 추출된 데이터가 스프레드시트에 바로 삽입됩니다.

 

 

AI의 Google 설문지 플러그인 찾아보기

이 플러그인은 Google 설문지를 위한 추가 기능을 제공합니다:

  • 로봇은 입력 매개변수 집합을 강조 표시하고 버튼을 클릭하여 Google 설문지에서 직접 실행할 수 있습니다.
  • Google 설문지에서 오래된 데이터를 자동으로 삭제합니다.
  • Google 스프레드시트에서 중복을 자동으로 제거합니다.

 

 

11) 커넥터 통합(재피어, 메이크, 파블리)

 

타사 통합 소프트웨어를 몇 번만 클릭하면 이러한 기본 통합 방법을 통해 Browse AI를 5000개 이상의 다른 앱과 연결할 수 있습니다:

  • [Zapier운영은 쉽지만 대량으로 사용할 경우 비용이 많이 듭니다.
  • [만들기] 비용은 저렴하지만 사용법이 더 복잡합니다.
  • [파블리 커넥트] 일회성 유료 평생 이용권을 구매한 사용자가 비용을 절약하기 위해 자주 사용합니다.

 

 

12) API 및 웹훅

 

팀에 소프트웨어 개발자가 있다면 제어판에서 거의 모든 작업을 할 수 있고(새 봇 생성 제외) 공개적으로 사용 가능한 API 및 웹후크와 프로그래밍 방식으로 인터페이스할 수 있는 API 및 웹후크를 활용하세요.

일부 스타트업은 Browse AI의 API를 기반으로 소프트웨어를 구축하고 노동 집약적인 데이터 크롤링을 모두 아웃소싱했습니다.

© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...