目标网站一般是如何识别使用了代理IP的
2021-03-18
有些人说,为什么我用了高匿代理IP,还是被识别了?难道我用的是个假高匿代理IP吗?
目标网站一般是如何识别使用了代理IP的
一、cookie检测
有的网站,虽然你切换了代理IP,也换了新账号去做,但是还是会无法访问公开数据号,比如一些常见的问答平台,很多做营销推广的一般都是用代理IP,然后自问自答自采纳,但是结果还是会无法访问公开数据号,这是因为问答平台会根据cookie来判断你是否是真正的用户,切记在切换代理IP和账号之前,先清除cookie,好是换浏览器换电脑。
二、访问频率检测
虽然使用代理IP,但是如果访问频率超快,达到目标网站设定的阈值,仍然会允许访问公开数据访问;虽然访问频率不高,但是访问很有规律,每页3秒钟,这样也会被目标网站识别,也会被允许访问公开数据访问。用代理IP访问时,好不要太快,当页面访问完时,无规律地休眠几秒钟,这样很难识别。
三、验证码检测
随着验证码技术的发展,现在的验证码是五花八门,一开始的简单数字字母,到后来的加减乘除,到现在的滑块验证,按顺序点图片和文字等等,简直防不胜防。即使用了代理IP,还是会经常遇到验证码,登录时也会遇到验证码,访问过快也会遇到验证码,访问多少次也会遇到验证码,等等。
四、请求头检测
爬虫并不是用户,在访问浏览时,如果没有其他的特征,目标网站是可以根据检测爬虫的请求头来检测对方到底是用户或者爬虫。因此在使用代理IP访问网站时,一般会收集到大量的user-agent,然后随机切换,以防被识别。
以上是一些常见情况,还有很多其他情况。不同的网站有不同的策略,需要我们深入研究。如果不处理这些,即使使使用代理IP也会被识别。
声明:本文来自网络投稿,不代表IPIDEA立场,若存在侵权、安全合规问题,请及时联系IPIDEA进行删除。
上一篇:爬虫代理IP是什么呢?