2013年02月27日 PHP开源系统 暂无评论 阅读 497 views 次

在目前的站长圈内,比较流行的采集工具有很多,但是总结起来,比较出名的免费的就这么几个:火车头,海纳,云采集,ET,三人行,狂人。
下面我们对这几款采集工具作一个简单的比较和评比。

1. 火车头
火车头应该是国内采集软件成功的典型之一,使用人数包括收费用户数量上应该是最多的。
特色:功能强大,速度快,支持的网站最丰富,支持丰富扩展。
优点:功能齐全,采集速度比较快,主要针对CMS,短时间可以采集很多,过滤,替换都不错,比较详细;很多人写接口、规则和发布模块,接口比较齐全;支持的扩展非常好用,如果你是一位懂技术的站长,可以使用PHP或C#开发任意功能的扩展;附件采集功能完善。
缺点:采集规则编写对很多站长是个不小的门槛。功能增多,软件越来越大,比较占用内存和CPU资源,资源回收控制得不好。另外,授权绑定计算机,有时很不方便。只能在Windows平台下使用,没有Linux版本。
技术:技术主要是论坛支持,帮助文件多。有收费、免费版本。
网址:火车头官网

2. 海纳
特色:关键词抓取,可以预览采集内容,不用写规则。
优点:可以抓取网站很多一个关键词文章,似乎适合做网站的专题,特别是文章类、博客类。
缺点:分类不方便,即采集文章归类不方便,要手动(自动容易混淆),特定接口,采集的内容有限,一次只能采集一条,无法批量采集,需要和网站后台网页对接。安装时,需要海纳的人员上门技术支持,比较麻烦。
技术:无论坛。收费,免费的功能限制太大,形同鸡肋。
网址:海纳官网

3. 云采集
特色:完美无缝的集合了火车头和海纳的优点,功能强大,速度快,关键词抓取,不用写规则。提供基于网络的接口供第三方调用,创新给力。
优点:功能强大,不需要写任何规则,软件使用简单,多线程,速度快,可以多个关键词采集,可以批量采集批量入库,傻瓜式采集,可以定时采集和发布,无人值守,适合做网站专题。能够和任意CMS,如PHP、ASP.NET(C#)、JSP、Ruby等开发的CMS紧密整合。和网站后台频道无缝对接,方便文章发布。安装简单,支持Windows和Linux。
缺点:虽然也较为有名,但与火车头和海纳相比,发展时间相对较短,相对新锐,偶尔采集的内容不太准确,不过很容易校正调整。
技术:QQ技术支持、论坛、微博。有永久免费版本、收费版本。收费版本也可以通过嵌入代码资源交换方式免费使用,很灵活。
网址:云采集官网

4. ET工具
特色:无人值守,稳定,资源占用最低,基本上可以叫安静。
优点:无人值守,自动更新,用户群主要集中在长期做站潜水站长。软件清晰,必备功能也很齐全,软件免费,听说已经增加采集中英文翻译功能。
缺点:对论坛和CMS的支持一般。
技术:论坛支持,软件本身免费,但是也提供收费服务。帮助文件较少,上手不容易。
网址:ET官网

5. 三人行
主要针对论坛的采集,功能比较完善。先申明,不知道三人行和狂人是什么关系,但界面和功能都是一个模子出来的。
特色:针对各大论坛,搬家,移动,速度快,准确度高。
优点:还是针对论坛,适合开论坛的。
技术:收费技术,免费有广告。
缺点:超级复杂,上手难,对CMS支持比较差。
网址:三人行官网

6. 狂人
特色:可以让你的新论坛一开始就会有大量的会员。
优点:非常适合采集discuz论坛。
缺点:过于专一,兼容性不好。
网址:狂人官网

总结:追求简单易用,功能较为齐全的,可以选择云采集。追求功能非常齐全的,可以选择火车头。云采集和火车头都能迅速采集很多的资源,充实网站内容。如果做论坛,那选择三人行,可以实现采集论坛,回复,搬家等多项论坛功能。长期做站,可以选择ET或云采集,花点时间,弄懂,是个长期受益的事情,他们都可以像开QQ一样,长期运行,不费内存,自动采集更新。至于海纳,似乎不写规则,上手容易,但是对文章的发布上,比较麻烦。另外,这里只讲了六大主要的采集工具,其实还有网络矿工、网络神采、易采、gooseeker、soukey、小猪采集器、超级采集、千帆采集等等,这些采集器也是各有优缺点,但总体上来说属于采集工具领域的第二梯队,就不一一再讲了。。。。。。

六大免费网站数据采集器对比(火车头,海纳,云采集,ET,三人行,狂人采集)的更多相关文章

  1. 转载《五大免费采集器哪个好,火车头,海纳,ET,三人行,狂人采集 》

    在目前的站长圈内,比较流行的采集工具有很多,但是总结起来,比较出名的免费的就这么几个:火车头,海纳,ET,三人行,狂人. 下面我们对这几款采集工具作一个简单的评比. 1.火车头 基本上人人都知道,那就 ...

  2. 免费网站监控服务阿里云监控,DNSPod监控,监控宝,360云监控使用对比

    网站会因为各种原因而导致宕机,具体表现为服务器没有响应,用户打不开网页,域名解析出错,搜索引擎抓取页面失败,返回各种HTTP错误代码.网站宕机可能带来搜索引擎的惩罚,网站服务器不稳定与百度关系文章中就 ...

  3. 分享一些比较好用的(免费)网站及推荐理由 SMARK

    分享一些比较好用的(免费)网站及推荐理由 --By SMARK 资源类 这里面是一些有供下载的资源的网站等 视频 片库 内容怎么样有待考证 蓝光网 看着还行, 打赏收入 预告片世界 还行, 收入有待考 ...

  4. 微信小程序/网站 上传图片到腾讯云COS

    COS简介: 腾讯云提供的一种对象存储服务,供开发者存储海量文件的分布式存储服务.可以将自己开发的应用的存储部分全部接入COS的存储桶中,有效减少应用服务器的带宽,请求等.个人也可以通过腾讯云账号免费 ...

  5. 网站http配置https -- 阿里云 nginx

    通过阿里云领取免费证书可将网站配置为https 步骤为下: 登陆阿里云点击sll证书,然后点击购买证书 选择免费的 然后立即购买 购买后会让你填写一些域名信息 然后提交签发证书 签发后点击下方下载 选 ...

  6. 如何用云存储和CDN加速网站图片视频、阿里云OSS的使用(转)

    总有人说阿里云主机带宽小,那只是因为你还停留在单机架构上. 阿里的架构设计,云主机主要用来跑程序的,附件的存储和访问主要靠OSS. 有人又会说了,OSS按存储费+流量双重计费伤不起,只是你不知道OSS ...

  7. 百度网站统计和CNZZ网站统计对比

    一,前言 百度统计和cnzz统计是目前市面上比较流行的两种web统计工具,接下来将对两个统计工具做初步的体验测评 百度网站统计相关介绍:全球最大的中文网站流量分析平台,帮助企业收集网站访问数据,提供流 ...

  8. 比较Windows Azure 网站(Web Sites), 云服务(Cloud Services)and 虚机(Virtual Machines)

    Windows Azure提供了几个部署web应用程序的方法,比如Windows Azure网站.云服务和虚拟机.你可能无法确定哪一个最适合您的需要,或者你可能清楚的概念,比如IaaS vs PaaS ...

  9. 开源企业IM,免费企业即时通讯软件-ENTBOOST云通讯平台Windows(r174)版本号公布

    经过恩布团队全体成员的不懈努力,依照原定计划,最终在今天(5月14日)公布第二个开源版本号,恩布企业互联IM,ENTBOOST 0.2.0(r174beta)Windows版本号:主要功能支持文本.表 ...

随机推荐

  1. Android开发环境搭建(jdk+eclip+android sdk)

    在开启Android 开发之旅之前,首先要把准备工作做好---搭建开发环境 一.环境搭建: 1.Java JDK 安装 2.Eclipse 安装 3.Android SDK 安装 4.ADT安装 5. ...

  2. vue-新建项目出错情况分析

    1.状况一: 按照正常流程新建项目,最终运行npm run dev 的时候,就频频出错,最终找出问题原来在于部分依赖包丢失了,于是重新安装所需要的依赖包再运行项目便好了!

  3. guava学习--Objects

    转载:https://my.oschina.net/realfighter/blog/349821 Java中的Object类是所有Java类的超类(也就是祖先),所有对象都实现Object类中的方法 ...

  4. js 判断IE浏览器,包含IE6/7/8/9

    //判断IE6-9的版本,num可取值为6/7/8/9//若不给参数num,仅判断浏览器是否为IE,不判断版本 var isIE = function (num) { if(arguments.len ...

  5. js Date 函数方法 和 移动端数字键盘调用

    var myDate = new Date(); myDate.getYear(); //获取当前年份(2位) myDate.getFullYear(); //获取完整的年份(4位,1970-???? ...

  6. vuejs开发组件分享之H5图片上传、压缩及拍照旋转的问题处理

    一.前言 三年.net开发转前端已经四个月了,前端主要用webpack+vue,由于后端转过来的,前端不够系统,希望分享下开发心得与园友一起学习. 图片的上传之前都是用的插件(ajaxupload), ...

  7. Debian/Ubuntu/CentOS VPS安装Net-Speeder并优化

    安装过程: CentOS安装 wget --no-check-certificate https://gist.github.com/LazyZhu/dc3f2f84c336a08fd6a5/raw/ ...

  8. Nuget包之间的依赖

    为什么我们使用依赖呢??原因是某些资源是基于某些资源的基础上才可以运行的,比如bootstrap基于Jquery,EntityFramework.zh-Hans基于EntityFramework,如果 ...

  9. 写一个程序可以对两个字符串进行测试,得知第一个字符串是否包含在第二个字符串中。如字符串”PEN”包含在字符串“INDEPENDENT”中。

    package lovo.test; import java.util.Scanner; public class Java { @param args public static void main ...

  10. Makefile 一点一滴(二)—— 输出文件到指定路径

    先来看最简单的 makefile 文件: TestCpp : TestCpp.o g++ -o TestCpp TestCpp.o TestCpp.o : TestCpp.cpp g++ -c Tes ...