写在前边的话: 最近找了一个云计算开发的工作,本以为来了会直接做一些敲代码,处理数据的活,没想到师父给了我一个课题“基于质量数据的大数据分析”,那么问题来了首先要做的就是搭建这样一个平台,毫无疑问,底层采用hadoop集群,在此之上,进行一些其他组件的安装和二次开发 hadoop伪分布部署参考:点击打开链接 hadoop单机版部署参考:点击打开链接 zookeeper,hive,hbase的分布式部署参考:点击链接 Spark,Sqoop,Mahout的分布式部署参考:点击链接 hadop高可用…