12 conceptos clave que debe conocer sobre el uso de Browse AI

Visite La IA permite extraer y controlar datos de cualquier página web en cuestión de minutos y sin código. Los bots que entrenes para operar sitios web como lo hacen los humanos te permitirán extraer los datos más precisos con el menor esfuerzo. Esta guía presenta algunos conceptos clave que le ayudarán a empezar.

 

 

1) Robótica

 

Puede entrenar a unmecánicopara automatizar una serie de pasos en su sitio web que normalmente tendría que hacer manualmente.

Por ejemplo, un robot puede realizar todos los comportamientos siguientes mientras ejecuta una tarea:

  • Abrir la página
  • tocar tierra (de tifón, etc.)
  • pulsar un botón
  • rellenar un formulario
  • Seleccione en el menú desplegable
  • Extraer datos estructurados de páginas web a hojas de cálculo
  • Pulse el botón "Siguiente" o "Cargar más" para obtener más datos.
  • capturar una imagen mostrada en la pantalla de un ordenador
  • Supervisar los cambios visuales o de contenido en partes específicas de una página web

 

El bot tiene [parámetros de entrada] dinámicos que le permiten ajustar la URL de la página web alias [URL de origen] o la entrada de texto en cada ejecución. Esto permite utilizar el mismo bot para extraer o monitorizar datos en un número ilimitado de páginas de un sitio con un diseño similar.

 

La mayoría de la gente crea robots que simplemente abren una página web y extraen datos de ella. Los usuarios pueden utilizar [ejecución por lotes] en decenas de miles de páginas similares de un sitio web para extraer rápidamente todo el conjunto de datos.

 

Los bots también hacen muchas cosas en segundo plano de las que podrías no darte cuenta, como resolver CAPTCHAs, utilizar direcciones IP residenciales geolocalizadas, imitar el comportamiento humano para evitar ser detectados, adaptarse automáticamente a los cambios del sitio web y, esencialmente, automantenerse.

 

 

2) Robots prefabricados frente a robots a medida

 

Los robots se pueden crear utilizando [Robot prefabricado], o utilizando la grabadora Browse AI y su interfaz click-to-extract. Cada bot tiene algunos [Parámetros de entrada] (por ejemplo, dirección web) que puedes ajustar cada vez que lo ejecutes.

Los bots preconstruidos se aplican a casos de uso populares y cada semana se publican nuevos. Algunos ejemplos son la extracción de datos de sitios web de empresas como Yelp, TripAdvisor o LinkedIn.

 

Más de 901 usuarios de TP3T of Browse AI crean bots personalizados entrenados para casos de uso específicos. Por ejemplo, algunos agentes inmobiliarios supervisan [observan] los permisos de construcción emitidos por el gobierno de su condado (en el sitio web oficial del condado) y lo conectan a un CRM de ventas o a una hoja de cálculo que envía automáticamente correos electrónicos a cada constructor que obtiene un permiso de construcción.

 

 

3) URL de origen

 

Cada [bot personalizado] tiene una URL de origen [parámetro de entrada], que por defecto apunta al enlace en el que fueron entrenados. Puedes extraer o monitorizar datos de cualquier otra página de ese sitio con un diseño similar modificando la URL de origen.

 

Por ejemplo, si quisiera [supervisar] los precios de los productos de Walmart, podría entrenar un bot personalizado en una página de productos de Walmart y, a continuación, ajustar la URL de origen de cada supervisión para configurar ese bot para que supervise 100 páginas de productos diferentes.

 

 

4) Tareas

 

Cada [bot] está entrenado para realizar una tarea específica. Cada vez que ejecutas ese bot, realiza esa tarea, y los detalles de la tarea (incluidos los datos que se extrajeron), se almacenan bajo esa tarea en la pestaña Historial del bot.

 

Si configuras un bot de monitorización para [monitorizar] los cambios de la página web a diario, puede que necesite ejecutar una tarea al día, o unas 30 tareas al mes.

 

Las nuevas tareas pueden crearse de varias maneras:

  • Puedes abrir un bot en tu panel de control, ir a su pestaña Ejecutar tareas y ejecutar una tarea.
  • En la pestaña Ejecutar tareas, también puede seleccionar [Ejecución por lotes] para ejecutar hasta 50.000 tareas a la vez cargando archivos CSV.
  • Si configura un monitor, se creará automáticamente una nueva tarea de monitorización cada vez que necesite realizar una comprobación de monitorización.
  • Si integra Browse AI con otro software o utiliza la API, se pueden crear nuevas tareas a través de la API.
  • Ocasionalmente, el sistema creará tareas para garantizar que el robot está en buen estado o para optimizarlo para que sea más rápido o fiable. Las tareas se marcarán como "ejecutadas por el sistema".

 

 

5) Supervisar

 

Una de las funciones más útiles de Browse AI es el sistema de supervisión incorporado.

Cada robot puede configurarse con un número infinito de monitores, cada uno de los cuales corresponde a una página del sitio web o a una condición de búsqueda que debe supervisarse.

Por ejemplo, podría utilizar un bot para supervisar todos los productos de un sitio de comercio electrónico y recibir notificaciones cuando cambien los precios o un producto esté disponible.

El monitor puede detectar cambios y puede configurarse para enviar una notificación por correo electrónico cuando se detecta un cambio o enviar automáticamente los datos a otro programa informático.

 

 

6) Parámetros de entrada

 

Cada bot está equipado con parámetros de entrada que pueden ajustarse y supervisarse en función de los requisitos de la tarea, lo que significa que no es necesario volver a crear bots para cada página o término de búsqueda de su sitio web.

 

El parámetro de entrada más común es [URL de origen], que es la página que el robot visita por primera vez.

Cuando personalice su robot, si introduce algún texto, lo que introduzca se convertirá en un parámetro de entrada que podrá ajustarse posteriormente.

 

 

7) Ejecución por lotes

 

La función Ejecución por lotes está disponible en la pestaña Ejecutar tareas del Panel de control del robot. Esta función le permite cargar un archivo CSV que contenga hasta 50.000 conjuntos diferentes de [Parámetros de entrada] y crear inmediatamente una [Tarea] para cada conjunto de parámetros. Las tareas se pondrán en cola para su procesamiento y, una vez finalizado, se le proporcionará el conjunto de datos completo extraído.

 

Por ejemplo, puede cargar un archivo CSV que contenga enlaces a 50.000 páginas de empresas en LinkedIn y obtener todos los datos extraídos de esas páginas.

 

 

8) Arrastre profundo

 

Deep Crawl es un término de uso común que se refiere al rastreo de una lista de enlaces de una página de una categoría determinada y la posterior extracción de los detalles de cada enlace.

 

Este enfoque le permite recopilar datos detallados y pormenorizados de páginas o secciones de su sitio web.

 

Más información sobre el uso de Buscar IA Realizar un rastreo profundo de [artículo relacionado].

 

 

9) Aplicaciones integradas

 

A menudo, necesitará transferir los datos capturados en su sitio web a otro software que utilice, como Google Forms o CRM.Browse AI ofrece más de 5.000 integraciones para facilitarle la importación de datos desde cualquier sitio web a las herramientas que ya utiliza.

 

 

10) Integración de Google Forms con Airtable

 

Ya existen integraciones directas para [Google Forms] y Airtable. Una vez configurado en el robot, cada vez que éste realiza una tarea, los datos extraídos se insertan directamente en su hoja de cálculo.

 

 

Navegar por el plugin Google Forms de AI

Este plugin proporciona funciones adicionales para Google Forms:

  • El robot puede ejecutarse directamente en Google Forms resaltando el conjunto de parámetros de entrada y haciendo clic en el botón.
  • Eliminación automática de datos antiguos de Google Forms.
  • Elimina automáticamente los duplicados de las hojas de cálculo de Google.

 

 

11) Integración de conectores (Zapier, Make, Pabbly)

 

Con unos pocos clics de software de integración de terceros, estos métodos de integración nativa le permitirán conectar Browse AI con más de 5000 aplicaciones:

  • [Zapier...] Fácil de manejar, pero costosa cuando se utiliza en grandes cantidades.
  • [Visitecuesta menos, pero es más complicado de usar.
  • [Pabbly Connect] Suelen utilizarlo los usuarios que han adquirido un contrato vitalicio de pago único para ahorrar dinero.

 

 

12) API y Webhooks

 

Si tiene desarrolladores de software en su equipo, asegúrese de aprovechar las API y los webhooks, que le permiten hacer casi todo en el panel de control (excepto crear nuevos bots) e interactuar mediante programación con API y webhooks disponibles públicamente.

Algunas empresas emergentes han creado su software basándose en las API de Browse AI y han subcontratado todo el rastreo de datos, que requiere mucho trabajo.

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...