spark 是基于内存计算的 大数据分布式计算框架,spark基于内存计算,提高了在大数据环境下处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将spark部署在大量廉价的硬件上,形成集群. 1. 分布式计算2. 内存计算3. 容错4. 多计算范式 Messos 作为资源管理框架.相当于yarn,进行资源管理以及调度. spark生态系统,不提供存储层,可以调用外部存储,例如HDFS Tachyon 是 分布式内存文件系统,能够缓存数据,并提供数据快速读写. spark 是核心计算引擎,能…