一. 读取和保存说明 SparkSQL提供了通用的保存数据和数据加载的方式,还提供了专用的方式 读取:通用和专用 保存 保存有四种模式: 默认: error : 输出目录存在就报错 append: 向输出目录追加 overwrite : 覆盖写 ignore: 忽略,不写 二. 数据格式 1. Parquet Spark SQL的默认数据源为Parquet格式.Parquet是一种能够有效存储嵌套数据的列式存储格式. 数据源为Parquet文件时,Spark SQL可以方便的执行所有的操作,不需…