一, 简介 Spark SQL是用于结构化数据处理的Spark模块.与基本的Spark RDD API不同,Spark SQL提供的接口为Spark提供了关于数据结构和正在执行的计算的更多信息.在内部,Spark SQL使用这些额外的信息来执行额外的优化.有几种与Spark SQL进行交互的方式,包括SQL和Dataset API.在计算结果时,使用相同的执行引擎,而不管使用哪种API /语言表示计算.这种统一意味着开发人员可以轻松地在不同的API之间来回切换,基于这些API提供了表达给定转换的