Hadoop产生背景: 传统方式,我们使用数据库来对数据进行管理.可是随着数据量的增加,我们要对这个数据库中的海量数据进行处理, 从中提取出有效的信息,这时候面临的问题随之而来: 1.海量数据读取,采用多个硬件读取,如果硬件故障了怎么办? 2. 1个磁盘读取的数据可能和另外99个磁盘读取的数据合并起来才能使用,如何保证这个不同数据组合的正确性? 这便是Hadoop要解决的问题.Hadoop使用了HDFS分布式文件系统,计算架构Map reduce以及结构化数据处理的Hbase.基于zooKee…