Browse AI的设计目标是适应所有网站,但我们也有一些限制。
新建的自定义机器人约有90%的成功概率。其余10%的失败情况主要有以下原因:
1. 我们只能解决某些类型的验证码(比如ReCaptcha, hCaptcha),但不是全部。比如,我们目前不能解决自定义的验证码。
2. 有些网站的机器人检测机制较强。Browse AI尽量模仿人类行为,用类似于常规用户的浏览器会话,同样的延迟、暂停和滚动等行为。我们也会更换IP地址(通常选择机器人设置者所在的国家的IP),并尽量避免使用相同的IP地址。
但是,无论我们怎么做,如果你的机器人需要登录网站(不论是用你的会话cookies或者登录凭证),网站始终能检测到两件事:A)此用户从至少两个不同的IP地址登录(你的本地IP和Browse AI的IP),B)如果你的机器人运行的任务不少,可能引起可疑。
因此,登录状态的机器人在使用云端网络自动化时,会有更高的被检测到的风险。若要避开此问题,你可以在你本地的机器上运行自动化,但是我们现在还不支持这项功能。
3. 当网站有A/B测试时, 如果训练你机器人的版本和机器人执行任务时遇到的版本不同,它**可能**不能完成任务或抓取错误的数据。机器人可以适应一些变化,但并非所有。
4. 少数网站会渲染**虚拟列表**。这种列表在你向下滚动时,只渲染可见的项,不可见部分则完全无任何渲染。我们的软件还未兼容这些列表,但我们计划未来支持。
5. 我们还不支持与iFrames进行交互或从中抓取数据。一种解决方法可以是检查iFrame去找到它的URL。有些iFrames有URL地址,可以直接加载这个iFrame。之后,你就可以训练一个新的机器人去加载这个iFrame,并且与之交互或提取信息。
6. 尽管如此,因为网上的网站有数十亿个,总会出现一些边缘案例,源于不可访问的代码或违反网站规定的模式。每当我们遇到新的边缘案例,我们会尽力更新软件以解决这个以及类似的问题。
你刚刚创建的新的自定义机器人是否因为上述以外的原因挂了?
记得使用“报告”按钮来告诉我们。我们会尽快处理并回复你。