intersect except是spark提供的集合差集运算, 但是要求参与运算的两个dataframe,有相同的data Schema. 如果我想从 集合1(attribute1, attribute2, attribute3)求 attribute2 出现在另一个集合2(attribute2, attribute4, attribute5)里的所有行 则intersect 完全无效, 我刚接触spark没多久, 只好就绕了一下路. 实践如下. multiple_orders$forJoin…