Spark SQL有两种方法将RDD转为DataFrame. 1. 使用反射机制,推导包含指定类型对象RDD的schema.这种基于反射机制的方法使代码更简洁,而且如果你事先知道数据schema,推荐使用这种方式: 2. 编程方式构建一个schema,然后应用到指定RDD上.这种方式更啰嗦,但如果你事先不知道数据有哪些字段,或者数据schema是运行时读取进来的,那么你很可能需要用这种方式. 利用反射推导schema Scala Java Python Spark SQL的Scala接口支持自动…