一.JDBC数据源案例 1.概述 Spark SQL支持使用JDBC从关系型数据库(比如MySQL)中读取数据.读取的数据,依然由DataFrame表示,可以很方便地使用Spark Core提供的各种算子进行处理. 这里有一个经验之谈,实际上用Spark SQL处理JDBC中的数据是非常有用的.比如说,你的MySQL业务数据库中,有大量的数据,比如1000万,然后,你现在需要编写一个程序, 对线上的脏数据某种复杂业务逻辑的处理,甚至复杂到可能涉及到要用Spark SQL反复查询Hive中的数据,