火车采集器(LocoySpider) v2009 sp2 Build 20090428

一款免费的,功能强大的网络数据采集软件,知识兔可以快速高效的获取网络上的文字,图片,下载等资源,将您从重复的复制粘贴中解放出来。
软件简介:
火车采集器(LocoySpider)是一个功能强大的数据采集软件.使用它,您可以很容易的从网页上抓取文字,图片,文件等资源.程序支持远程下载图片文件,知识兔支持网站登陆后信息采集,知识兔支持探测文件真实地址,知识兔支持代理,知识兔支持防盗链的采集,知识兔支持采集数据直接入库和模仿人手工发布等.同时,软件具有极高的稳定性,知识兔可以多线程,多任务的工作,您可以用它进行大批量数据的更新.程序还支持多页和分页的采集,再难的数据格式也可以找到解决方案.

软件应用范围:
1.网站采编人员:打破传统的采编人员必须手工转载文章的现状,使他们更有时间去做数据的编辑加工,工作更有成效.程序可以完美结合TRS等采编系统,大型网站的信息采集将更加容易有效.
2.内部网络:打破内网信息单一,获取困难的神话,内部网络也可以体验丰富多彩的互联网信息.可以解决形如军队等与因特网隔离的重要部门对于因特网的信息需求问题 .
3.政府机关:实时跟踪、采集与政府工作相关的国内外及地方新闻,政策法规,经济,产业等信息,知识兔解决政府主网站对各地级子网站的信息采集与整合问题.
4.企业应用:实时而准确地采集国内外新闻,行业新闻,技术文章.可以很容易的进行数据整合,情报处理更快捷高效,大大减少业务成本.
5.SEO人员或站长:数据的获得更加容易,可迅速增加网站信息量,知识兔可以将更多精力放在优化和推广上.

火车采集器特有的功能:
1.支持所有编码格式的数据采集,您可以用它采集全世界的文章.程序还可以进行编码间的完美转换.
2.多接口;支持所有主流或非主流的CMS,BBS,下载站等,您可以通过系统的接口实现采集器和网站的完美结合.
  3.无人值守工作:您配置好程序以后,程序就可以按照您的设置自动运行,完全不需要人工干预.
4.本地编辑采集数据:您可以在本地可视化编辑已采集的数据.
5.采集内容测试功能:这是其它任何采集软件所不能比的,可直接查看结果并测试发布.
6.管理方便:使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松.

更新日志:
改进了PHP接口的功能,php接口接收和返回整个标签内容数组集合,知识兔支持各个标签间相互调用及处理
标签内增加不得重复的设置,知识兔可以对过滤掉重复的标签内容了!(不只是简单的网址重复过滤)
对采集过程中出现错误的记录有错误处理机制了。以前网络出现错误时一样会标记为采集成功。
去掉了免费版内2%的随机广告.
添加了标签结果不符合要求的处理方法,全局设置内增加可选是否删除或标记为已采的选项
修复了附件下载时中文乱码及多次跳转无法得到正确文件名的bug
ubb发表添加了表格支持
web发布时自动加载需要的标签
修改了智能提取标签时提取了缩略图的bug
模块编辑器支持update语句.
优化了中文分词模块
优化了ftp上传模块,将不再出现文件已经实际下载却提示未找到任务可以上传文件的情况
修正了入库配置里端口的设置显示问题.
解决了因sql语句大小写问题导致入库不成功的bug.
修正了explorer意外结束后程序托盘图标无法显示的问题.
循环采集时内容合并的间隔符号,不能是半角空格的bug
修复了部分版本中任务列表框在三个步骤全不选后任务自动消失的bug.
修复了自动运行中部分情况下不能自动停止及采完网址不继续采内容的bug.
修复了导入带有从文件导入网址的任务规则时文本文件没有同步导出的bug.
修复了web上传文件时[本地文件循环:标签]中标签的设置不起作用及所有的类型均是text/plain的bug.>

下载仅供下载体验和测试学习,不得商用和正当使用。

下载体验

请输入密码查看下载!

如何免费获取密码?

点击下载

评论