之前的数据抓取都是用的八爪鱼软件,老大突发奇想要我自己搞个爬虫来抓取数据,网上找找貌似apache的nutch比较合适,于是就开始安装这啥nutch. 对于一个linux零基础的人来说,还要先学学linux,大致了解了ssh连接工具怎么用后就开始正事了.了解到从nutch2开始,源码就必须要自己编译了,所以还要先安装ant.低版本的ant还不行,需要1.6以上的,所以找了个最新的. ant安装:(ant是基于java的,所以要先确保系统中已经安装了jdk) 1.下载地址:http://ant.a…