1.使用mapPartitions算子提高性能 mapPartition的优点:使用普通的map操作,假设一个partition中有1万条数据,那么function就要被执行1万次,但是使用mapPartitions操作之后,function仅仅会被执行一次,显然性能得到了很大的提升,这个就没必要在多废话了. mapPartition的缺点:使用普通的map操作,调用一次function执行一条数据,不会出现内存不够使用的情况:但是使用mapPartitions操作,很显然,如果数据量太过于大的…