1.hadoop是什么? 开源的分布式存储和分布式计算平台. 2.hadoop组成? HDFS:分布式文件存储系统,存储海量数据. Mapreduce:并行处理框架,实现任务分配和调度. 3.hadoop可以用来做什么? 搭建大型数据仓库,分析海量日志,存储,统计等. 4.Zookeeper 分布式协作服务 解决分布式环境下的数据管理: 统一命名,状态同步,集群管理,配置同步 5.HIVE 数据仓库(离线分析) HQL用于运行存储在Hadoop上的查询语句,Hive让不熟悉MapReduce开发…