0.Hadoop hadoop主要是用来对海量数据进行存储和计算的. 它本身是一个分布式系统,核心由分布式文件系统hdfs,和分布式计算框架mapreduce组成,在存储和计算时能够发挥出集群中每台机器的能力. 所以,当单机文件系统没法存储,或者传统数据处理方式(例如数据库.shell脚本等)显得缓慢.没法忍受时,就可以考虑大数据方面的一些处理方案(例如nosql.hadoop.stormde). 当然,并不保证在传统方法处理不好的情况下,大数据相关的处理方案就能处理得好,这时最需要的是进行深入…