爬山虎采集器下载爬山虎数据采集器 v3.0.4.5 官方安装版

软件下载 7月 05, 2023 0 king

爬山虎采集器简单易学，通过可视化界面，鼠标知识兔点击即可抓取数据。内置一套高速浏览器内核，加上HTTP引擎模式，实现快速采集数据。爬山虎采集器能够采集互联网99%的网站，知识兔包括单页应用Ajax加载等等动态类型网站，需要的朋友赶紧下载吧。

功能介绍

　　向导模式

　　简单易用，轻松通过鼠标知识兔点击自动生成脚本

　　定时运行

　　可按照计划定时运行，无需人工

　　独创高速内核

　　自研的浏览器内核，速度飞快，远超对手

　　智能识别

　　对于网页中的列表、表单结构（多选框下拉列表等）能够智能识别

　　广告屏蔽

　　定制的广告屏蔽模块，兼容AdblockPlus语法，可添加自定义规则

　　多种数据导出

　　支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、网站等

软件特色

　　一键提取数据

　　简单易学，通过可视化界面，鼠标知识兔点击即可抓取数据

　　快速高效

　　内置一套高速浏览器内核，加上HTTP引擎模式，实现快速采集数据

　　适用各种网站

　　能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站

使用流程

　　1、输入采集网址

　　打开软件，新建任务，知识兔输入需要采集的网站地址。

　　2、智能分析，全程自动化提取数据

　　进入到第二步后，爬山虎采集器全自动智能分析网页，并且知识兔从中提取出列表数据。

　　3、导出数据到表格、数据库、网站等

　　运行任务，将采集到的数据导出为Csv、Excel以及各种数据库，知识兔支持api导出。

常见问题

　　问：如何过滤列表中的前N个数据？

　　1.有时知识兔需要对采集到的列表进行过滤，比如过滤掉第一组数据（在采集表格时，过滤掉表格列名）

　　2.知识兔点击列表模式菜单中的，知识兔设置列表xpath

　　问：如何抓包获取Cookie，并且知识兔手动设置？

　　1.首先，知识兔使用谷歌浏览器打开要采集的网站，并且知识兔登陆。

　　2.然后知识兔按下 F12,会出现开发者工具，知识兔选择 Network

　　3.然后知识兔按下F5，刷新下页面，选择其中一个请求。

　　4.复制完成后，在爬山虎采集器中，编辑任务，进入第三步，指定HTTP Header。

更新日志

　　3.0.2.8

　　2021/6/24

　　修复部分系统下任务结束时异常退出问题

　　修复编辑器中脚本命令一直等待问题

　　优化默认导出路径，记录上次保存目录

　　修复数据处理-文本替换不能保存换行问题

爬山虎采集器v3.0.2.7更新：

　　1、修复分页的采集优先级

　　2、提前检验xpath和正则的正确性

　　3、其他使用了Inputbox的验证修改

　　4、增加数据处理-前后缀

　　5、修复英文系统下乱码问题

　　6、修复小分辨率下，窗口超过屏幕问题

　　7、新增路由拨号和adsl拨号功能

　　8、对等待命令增加等待某元素

　　9、修复form的解析

　　10、任务列表按时间顺序排列

　　11、完善探测列表数据（列表就是a元素

　　12、修复下载文件无后缀问题

　　13、新增高级过滤功能

　　14、添加鼠标和键盘的模拟操作

　　15、增大滚动页数

下载仅供下载体验和测试学习，不得商用和正当使用。

点击下载

爬山虎采集器下载爬山虎数据采集器 v3.0.4.5 官方安装版

功能介绍

软件特色

使用流程

常见问题

更新日志

下载体验

Recent Posts

Recent Comments

热门

标签

Archives

Categories

评论

取消回复

功能介绍

软件特色

使用流程

常见问题

更新日志

下载体验

Recent Posts

Recent Comments

热门

标签

Archives

Categories

相似推荐

评论

取消回复