随着Spark SQL的正式发布,以及它对DataFrame的支持,它可能会取代HIVE成为越来越重要的针对结构型数据进行分析的平台.在博客文章What’s new for Spark SQL in Spark 1.3中,Databricks的工程师Michael Armbrust着重介绍了改进了的Data Source API. 我们在对结构型数据进行分析时,总不可避免会遭遇多种数据源的情况.这些数据源包括Json.CSV.Parquet.关系型数据库以及NoSQL数据库.我们自然希望能够以…