六大免费网站数据采集器对比(火车头,海纳,云采集,ET,三人行,狂人采集)
在目前的站长圈内,比较流行的采集工具有很多,但是总结起来,比较出名的免费的就这么几个:火车头,海纳,云采集,ET,三人行,狂人。
下面我们对这几款采集工具作一个简单的比较和评比。
1. 火车头
火车头应该是国内采集软件成功的典型之一,使用人数包括收费用户数量上应该是最多的。
特色:功能强大,速度快,支持的网站最丰富,支持丰富扩展。
优点:功能齐全,采集速度比较快,主要针对CMS,短时间可以采集很多,过滤,替换都不错,比较详细;很多人写接口、规则和发布模块,接口比较齐全;支持的扩展非常好用,如果你是一位懂技术的站长,可以使用PHP或C#开发任意功能的扩展;附件采集功能完善。
缺点:采集规则编写对很多站长是个不小的门槛。功能增多,软件越来越大,比较占用内存和CPU资源,资源回收控制得不好。另外,授权绑定计算机,有时很不方便。只能在Windows平台下使用,没有Linux版本。
技术:技术主要是论坛支持,帮助文件多。有收费、免费版本。
网址:火车头官网
2. 海纳
特色:关键词抓取,可以预览采集内容,不用写规则。
优点:可以抓取网站很多一个关键词文章,似乎适合做网站的专题,特别是文章类、博客类。
缺点:分类不方便,即采集文章归类不方便,要手动(自动容易混淆),特定接口,采集的内容有限,一次只能采集一条,无法批量采集,需要和网站后台网页对接。安装时,需要海纳的人员上门技术支持,比较麻烦。
技术:无论坛。收费,免费的功能限制太大,形同鸡肋。
网址:海纳官网
3. 云采集
特色:完美无缝的集合了火车头和海纳的优点,功能强大,速度快,关键词抓取,不用写规则。提供基于网络的接口供第三方调用,创新给力。
优点:功能强大,不需要写任何规则,软件使用简单,多线程,速度快,可以多个关键词采集,可以批量采集批量入库,傻瓜式采集,可以定时采集和发布,无人值守,适合做网站专题。能够和任意CMS,如PHP、ASP.NET(C#)、JSP、Ruby等开发的CMS紧密整合。和网站后台频道无缝对接,方便文章发布。安装简单,支持Windows和Linux。
缺点:虽然也较为有名,但与火车头和海纳相比,发展时间相对较短,相对新锐,偶尔采集的内容不太准确,不过很容易校正调整。
技术:QQ技术支持、论坛、微博。有永久免费版本、收费版本。收费版本也可以通过嵌入代码资源交换方式免费使用,很灵活。
网址:云采集官网
4. ET工具
特色:无人值守,稳定,资源占用最低,基本上可以叫安静。
优点:无人值守,自动更新,用户群主要集中在长期做站潜水站长。软件清晰,必备功能也很齐全,软件免费,听说已经增加采集中英文翻译功能。
缺点:对论坛和CMS的支持一般。
技术:论坛支持,软件本身免费,但是也提供收费服务。帮助文件较少,上手不容易。
网址:ET官网
5. 三人行
主要针对论坛的采集,功能比较完善。先申明,不知道三人行和狂人是什么关系,但界面和功能都是一个模子出来的。
特色:针对各大论坛,搬家,移动,速度快,准确度高。
优点:还是针对论坛,适合开论坛的。
技术:收费技术,免费有广告。
缺点:超级复杂,上手难,对CMS支持比较差。
网址:三人行官网
6. 狂人
特色:可以让你的新论坛一开始就会有大量的会员。
优点:非常适合采集discuz论坛。
缺点:过于专一,兼容性不好。
网址:狂人官网
总结:追求简单易用,功能较为齐全的,可以选择云采集。追求功能非常齐全的,可以选择火车头。云采集和火车头都能迅速采集很多的资源,充实网站内容。如果做论坛,那选择三人行,可以实现采集论坛,回复,搬家等多项论坛功能。长期做站,可以选择ET或云采集,花点时间,弄懂,是个长期受益的事情,他们都可以像开QQ一样,长期运行,不费内存,自动采集更新。至于海纳,似乎不写规则,上手容易,但是对文章的发布上,比较麻烦。另外,这里只讲了六大主要的采集工具,其实还有网络矿工、网络神采、易采、gooseeker、soukey、小猪采集器、超级采集、千帆采集等等,这些采集器也是各有优缺点,但总体上来说属于采集工具领域的第二梯队,就不一一再讲了。。。。。。
六大免费网站数据采集器对比(火车头,海纳,云采集,ET,三人行,狂人采集)的更多相关文章
- 转载《五大免费采集器哪个好,火车头,海纳,ET,三人行,狂人采集 》
在目前的站长圈内,比较流行的采集工具有很多,但是总结起来,比较出名的免费的就这么几个:火车头,海纳,ET,三人行,狂人. 下面我们对这几款采集工具作一个简单的评比. 1.火车头 基本上人人都知道,那就 ...
- 免费网站监控服务阿里云监控,DNSPod监控,监控宝,360云监控使用对比
网站会因为各种原因而导致宕机,具体表现为服务器没有响应,用户打不开网页,域名解析出错,搜索引擎抓取页面失败,返回各种HTTP错误代码.网站宕机可能带来搜索引擎的惩罚,网站服务器不稳定与百度关系文章中就 ...
- 分享一些比较好用的(免费)网站及推荐理由 SMARK
分享一些比较好用的(免费)网站及推荐理由 --By SMARK 资源类 这里面是一些有供下载的资源的网站等 视频 片库 内容怎么样有待考证 蓝光网 看着还行, 打赏收入 预告片世界 还行, 收入有待考 ...
- 微信小程序/网站 上传图片到腾讯云COS
COS简介: 腾讯云提供的一种对象存储服务,供开发者存储海量文件的分布式存储服务.可以将自己开发的应用的存储部分全部接入COS的存储桶中,有效减少应用服务器的带宽,请求等.个人也可以通过腾讯云账号免费 ...
- 网站http配置https -- 阿里云 nginx
通过阿里云领取免费证书可将网站配置为https 步骤为下: 登陆阿里云点击sll证书,然后点击购买证书 选择免费的 然后立即购买 购买后会让你填写一些域名信息 然后提交签发证书 签发后点击下方下载 选 ...
- 如何用云存储和CDN加速网站图片视频、阿里云OSS的使用(转)
总有人说阿里云主机带宽小,那只是因为你还停留在单机架构上. 阿里的架构设计,云主机主要用来跑程序的,附件的存储和访问主要靠OSS. 有人又会说了,OSS按存储费+流量双重计费伤不起,只是你不知道OSS ...
- 百度网站统计和CNZZ网站统计对比
一,前言 百度统计和cnzz统计是目前市面上比较流行的两种web统计工具,接下来将对两个统计工具做初步的体验测评 百度网站统计相关介绍:全球最大的中文网站流量分析平台,帮助企业收集网站访问数据,提供流 ...
- 比较Windows Azure 网站(Web Sites), 云服务(Cloud Services)and 虚机(Virtual Machines)
Windows Azure提供了几个部署web应用程序的方法,比如Windows Azure网站.云服务和虚拟机.你可能无法确定哪一个最适合您的需要,或者你可能清楚的概念,比如IaaS vs PaaS ...
- 开源企业IM,免费企业即时通讯软件-ENTBOOST云通讯平台Windows(r174)版本号公布
经过恩布团队全体成员的不懈努力,依照原定计划,最终在今天(5月14日)公布第二个开源版本号,恩布企业互联IM,ENTBOOST 0.2.0(r174beta)Windows版本号:主要功能支持文本.表 ...
随机推荐
- java-方法练习
一.定义方法的最主要的两个步骤: 1.先明确结果(即返回值类型要先明确) 2. 在实现功能时是否有未知内容参与运算,即明确函数的参数列表(参数类型,参数个数) 例如:定义一个九九乘法表的功能. 思路 ...
- SQLPlus 在连接时通常有四种方式
1. sqlplus / as sysdba 操作系统认证,不需要数据库服务器启动listener,也不需要数据库服务器处于可用状态.比如我们想要启动数据库就可以用这种方式进入 sqlpl ...
- 20169212《Linux内核原理与分析》第六周作业
视频学习 一.用户态.内核态和中断 内核态:处于高的执行级别下,代码可以执行特权指令,访问任意的物理地址,这时的CPU就对应内核态 用户态:处于低的执行级别下,代码只能在级别允许的特定范围内活动.在日 ...
- 懒加载实现的分页&&网站footer自适应
最近在做手机端,发现下拉刷新和上拉加载的jq控件很少而且自我感觉不好用,比如iscroll之类-- 然后自己写了个懒加载的,也很简单,最基础的代码[不喜勿喷,但蛮实用的] wap手机端懒加载分页: 用 ...
- PHP xml 转换为 array
retrun json_decode(json_encode(simplexml_load_string($xml, 'SimpleXMLElement', LIBXML_NOCDATA)), tru ...
- STC12C5A60S2 @ 22.0184Mhz 精确延时
#include "STC12.h" // STC12C5A60S2 @ 22.0184Mhz 精确延时 void delay_10us(unsigned char n) { un ...
- what is blade and soul Soul Shields
Soul Shields are sets of 8 fragments which serve as the main source of attributes to a character. Ad ...
- textbox button 模拟fileupload
方案一: <%@ Page Language="C#" AutoEventWireup="true" CodeBehind="test.asp ...
- Leetcode 详解(valid plindrome)
Question: Given a string, determine if it is a palindrome, considering only alphanumeric characters ...
- js判断数组
1.constructor 在W3C定义中的定义:constructor 属性返回对创建此对象的数组函数的引用 就是返回对象相对应的构造函数.从定义上来说跟instanceof不太一致,但效果都是一样 ...