一.概述 为什么要将RDD转换为DataFrame? 因为这样的话,我们就可以直接针对HDFS等任何可以构建为RDD的数据,使用Spark SQL进行SQL查询了.这个功能是无比强大的. 想象一下,针对HDFS中的数据,直接就可以使用SQL进行查询. Spark SQL支持两种方式来将RDD转换为DataFrame. 第一种方式 是使用反射来推断包含了特定数据类型的RDD的元数据.这种基于反射的方式,代码比较简洁,当你已经知道你的RDD的元数据时,是一种非常不错的方式. 第二种方式 是通过编程接…