爬虫-JS加密1 No Attempt


爬虫想要的数据可能是直接从HTML源码里面拿到,也可能是从AJAX请求里面拿到。这取决于开发者的方案。

由JS脚本发起的AJAX请求,由于经过了一道JS,那就可以有很多套路了。比如说对数据本身加解密,对请求增加验证签名。

有人可能会问,JS代码都下载到浏览器里面了,我看看你的JS代码做了什么,不就攻破了么。

这个问题由来已久。随着互联网页面里JS的逻辑越来越多,一个矛盾逐渐凸显——希望JS代码只能运行,而不允许别人改写或者借鉴。 就像客户端,是一个可执行文件,你可以执行,但是你不能借鉴其中的代码。

有没有办法把JS代码变成类似客户端只能执行,不能借鉴的代码呢?答案是可以的。并且非常成熟。所以,你确定你真的能看懂JS代码在做什么吗?

这里有一个网站,分了1000页,求所有数字的和。