一.Spark SQL简介 Spark SQL是Spark中的一个子模块,主要用于操作结构化数据.它具有以下特点: 能够将SQL查询与Spark程序无缝混合,允许您使用SQL或DataFrame API对结构化数据进行查询: 支持多种开发语言: 支持多达上百种的外部数据源,包括Hive,Avro,Parquet,ORC,JSON和JDBC等: 支持HiveQL语法以及Hive SerDes和UDF,允许你访问现有的Hive仓库: 支持标准的JDBC和ODBC连接: 支持优化器,列式存储和代码生成…