1.针对PostgreSQL数据库表的去重复方法基本有三种,这是在网上查找的方法,在附录1给出.但是这些方法对GreenPlum来说都不管用. 2.数据表分布在不同的节点上,每个节点的ctid是唯一的,但是不同的节点就有ctid重复的可能,因此GreenPlum必须借助gp_segment_id来进行去重复处理. 3.在网上找到了一个相对繁琐的方法,在附录2给出: 4.最终的方法是: delete from test where (gp_segment_id, ctid) not in (sel…
/** * 去除重复数据 * @author Sunqinbo */ public class RemoveDuplicateData { public static void main(String[] args) { Integer[] a = new Integer[] { 1, 4, 5, 2, -6, 5, 9, 10, 10 }; Set<Integer> set = new HashSet<Integer>(); for (int i = 0; i < a.le…
删除表中重复数据,留下ID比较小的行 delete from 表 where [重复字段] in (select [重复字段] from 表 group by 字段 having count([字段]) > 1) and ID not in (select min(ID) from [表] group by [字段] having count([字段])> 1)…