¿Qué sitios web admite Browse AI?

Browse AI está diseñado con el objetivo de adaptarse a todos los sitios web, pero tenemos algunas limitaciones.

 

Los robots personalizados de nueva creación tienen una probabilidad de éxito de unos 90%. Los 10% restantes de fallos se deben principalmente a las siguientes razones:

1. Sólo podemos resolver algunos tipos de CAPTCHA (por ejemplo, ReCaptcha, hCaptcha), pero no todos. Por ejemplo, no podemos resolver CAPTCHA personalizados por el momento.

2. Algunos sitios web disponen de potentes mecanismos de detección de bots. Browse AI intenta imitar el comportamiento humano en la medida de lo posible, utilizando una sesión de navegador similar a la de un usuario normal, con los mismos retrasos, pausas, desplazamientos, etc. También cambiamos las direcciones IP (normalmente elegimos la IP del país donde se encuentra el emisor del bot) e intentamos evitar utilizar la misma dirección IP.

Sin embargo, hagamos lo que hagamos, si tu bot necesita iniciar sesión en el sitio (ya sea con tus cookies de sesión o con tus credenciales de inicio de sesión), el sitio siempre podrá detectar dos cosas: A) que este usuario está iniciando sesión desde al menos dos direcciones IP diferentes (tu IP local y la IP de Browse AI), y B) si tu bot está ejecutando bastantes tareas, eso podría levantar sospechas.

Como resultado, los bots con sesión iniciada corren un mayor riesgo de ser detectados al utilizar la automatización web basada en la nube. Para evitar este problema, puede ejecutar la automatización en su máquina local, pero en este momento no admitimos esta función.

3. Cuando un sitio tiene pruebas A/B, si la versión que entrenó a su bot es diferente de la versión que el bot encuentra cuando realiza una tarea, es posible que no complete la tarea o que obtenga los datos incorrectos. Los bots pueden adaptarse a algunos cambios, pero no a todos.

4. Algunos sitios presentan **listas virtuales**. Estas listas sólo muestran los elementos visibles a medida que se desplaza hacia abajo, las partes invisibles no se muestran en absoluto. Nuestro software aún no es compatible con estas listas, pero tenemos previsto hacerlo en el futuro.

5. Todavía no podemos interactuar con iFrames ni rastrear datos desde ellos. Una forma de evitar esto es comprobar el iFrame para encontrar su URL, algunos iFrames tienen URLs que se pueden utilizar para cargar el iFrame directamente, y entonces puedes entrenar un nuevo bot para cargar el iFrame e interactuar con él o extraer información de él.

6. No obstante, dado que hay miles de millones de sitios web en la red, siempre habrá algunos casos extremos derivados de código inaccesible o patrones que violen las normas del sitio. Siempre que encontramos un nuevo caso extremo, intentamos actualizar el software para solucionar éste y otros problemas similares.

 

¿Se ha colgado el nuevo bot personalizado que acabas de crear por algún motivo distinto de los anteriores?

Recuerda utilizar el botón "Informar" para hacérnoslo saber. Nos pondremos en contacto contigo lo antes posible.

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...