近些年来Hadoop生态系统发展迅猛,它本身包含的软件越来越多,同时带动了周边系统的繁荣发展.尤其是在分布式计算这一领域,系统繁多纷杂,时不时冒出一个系统,号称自己比MapReduce或者Hive高效几十倍,几百倍.有一些无知的人,总是跟着瞎起哄,说Impala将取代Hive,Spark将取代Hadoop MapReduce等.本文则从问题域触发,解释说明Hadoop中每个系统独特的作用/魅力以及它们的不可替代性. Hadoop作为一个生态系统,每个系统只解决某一个特定的问题域(甚至可能很窄),…