当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具.这一切,都起源自Web数据爆炸时代的来临 数据抓取系统-Nutch 海量数据怎么存,当然是用分布式文件系统-HDFS 数据怎么用呢,分析,处理MapReduce框架,让你编写代码来实现对大数据的分析工作 非结构化数据(日志)收集处理-fuse,WebDav,Chukwa,flume,scribe…