随着Spark1.2的发布,Spark SQL开始正式支持外部数据源.这使得Spark SQL支持了更多的类型数据源,如json, parquet, avro, csv格式.只要我们愿意,我们可以开发出任意的外部数据源来连接到Spark SQL. 示例: 存储json数据. CREATE TEMPORARY TABLE jsonTable USING org.apache.spark.sql.json OPTIONS ( path '/path/to/data.json' ) 详细示例:1. D…