Spark简介: Spark是一个快速且通用的集群计算模型: 1.Spark是快速的:快速是指处理几T到几批数据量的时候,他的处理时间是几秒钟或几分钟,相对于hadoop的几分钟到几小时是非常快速的,通用是指Spark的应用场景比较多Spark扩展了MapReduce的计算模型Spark是基于内存计算的当我们在处理一个大批量数据的时候,难免呢会产生一些中间的数据结果,怎么处理呢第一种:放在硬盘中,硬盘会带来额外的写入写出的消耗第二种:直接存放到内存中,放到内存中肯定比放到硬盘中要快一些.所以Sp…