Spark SQL是为了让开发人员摆脱自己编写RDD等原生Spark代码而产生的,开发人员只需要写一句SQL语句或者调用API,就能生成(翻译成)对应的SparkJob代码并去执行,开发变得更简洁 注意:本文全部基于SparkSQL1.6 参考:http://spark.apache.org/docs/1.6.0/ 一. API Spark SQL的API方案:3种 SQL the DataFrames API the Datasets API. 但会使用同一个执行引擎 the same exe