爬虫-验证码-2 No Attempt


以往的人机验证,常规是出一道题(拉滑块,识别字符,做算式等),答对了就算通过。这样有两个问题:

  • 如果题目出的太难,会影响真实用户的体验,所以实际场景中题目都会相对比较简单。
  • 判定逻辑是公开的,爬虫可以针对判定逻辑来做开发。

而现代的人机验证,往往是隐藏检测点。如果触发检测点判定为爬虫,就会出非常困难的题,机器几乎不可能答出;而如果没有,甚至都不需要做题。 这样兼顾了用户体验的同时,让爬虫需要排查每一个可能的检测判定点。这里接入了一个类似这样的验证码,大家想想看,检测点可能会在哪里呢?

这里有一个网站,分了1000页,求所有数字的和。但是看到数字之前,需要通过验证码认证哦~