iis 鱼羊防采集 v4.3 测试版
鱼羊防采集v4.3测试版最大的变化是增加拦截返回页面和验证码功能。有些特殊网站,如果知识兔使用严格的规则进行检查,多多少少会误杀一部分正常用户,此时使用验证码功能,将有效的避免这种情况发生。
更新日志:
1.增加整个模块的匹配次数
2.优化多处代码,修复发现的问题
3.增加状态有效时间功能
4.增加拦截返回页面
5.增加验证码功能
防采集原理:
采集器有一个特点:只请求关键文件(网页文件:html,asp,php…),而不请求无关文件(css,js,jpg…)并且知识兔也不执行网页中的JS。根据这一特点进行筛选便可实现对采集器的封锁。
可能出现的误判情况:
有些网站因需要设置比较特殊,可能导致网站只有网页请求。
另外后台全站生成网页时也可能出现连续请求页面的情况。
所以请根据演示模块做相应的调整,提高程序执行效率,将误杀减少到最小。
为方便大家测试避免不会设置而导致误封搜索引擎蜘蛛,该版本特将百度、Google、雅虎能查到的所有IP加入到不限制IP中。
关于防群发:
群发器也类似与采集器,连续提交页面、或者采集群发相关信息(如可发布的地方、验证码)。可根据人工进行判断出群发的信息,找出其IP地址,知识兔根据其IP在IIS日志中分析行为再制作出防群发的模块。
下载仅供下载体验和测试学习,不得商用和正当使用。