随着两会中间央视新闻天天说大数据,很多人纷纷开始关注大数据和Hadoop以及数据挖掘和数据可视化了,我现在创业,遇到很多传统数据行业往Hadoop上面去转型的公司和个人,提了很多问题,大多数问题还都是差不多的.所以我想整理一些,也可能是很多人都关注的问题. 关于Hadoop版本的选择? 目前为止,作为半只脚迈进Hadoop大门的人,我建议大家还是选择Hadoop 1.x用.可能很多人会说,Hadoop都出到2.4,为啥还用1.x呢,说这话一听就没玩过hadoop. 理由一: Hadoop 1.x