并查集(Disjoint Set)
在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。这一类问题其特点是看似并不复杂,但数据量极大,若用正常的数据结构来描述的话,往往在空间上过大,计算机无法承受;即使在空间上勉强通过,运行的时间复杂度也极高,根本就不可能在规定的运行时间(1~3秒)内计算出试题需要的结果,只能用并查集来描述。
本文地址:http://www.cnblogs.com/archimedes/p/disjoint-set.html,转载请注明源地址。
定义
并查集(Disjoint Set),即“不相交集合”,是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。常常在使用中以森林来表示。集就是让每个元素构成一个单元素的集合,也就是按一定顺序将属于同一组的元素所在的集合合并。
将编号分别为1…N的N个对象划分为不相交集合,在每个集合中,选择其中某个元素代表所在集合。
常见两种操作:
- 合并两个集合
- 查找某元素属于哪个集合
算法实现
查找 Θ(1)
find1(x)
{
return set[x];
}
合并 Θ(N)
Merge1(a,b)
{
i = min(a,b);
j = max(a,b);
for (k = ; k <= N; k++) {
if (set[k] == j)
set[k] = i;
}
}
对于“合并操作”,必须搜索全部元素!有没有可以改进的地方呢?
算法的优化
使用树结构
每个集合用一棵“有根树”表示,定义数组 set[1..n]
- set[i] = i , 则i表示本集合,并是集合对应树的根
- set[i] = j, j<>i, 则 j 是 i 的父节点.
查找 最坏情况Θ(N)
find2(x)
{
r = x;
while (set[r] != r)
r = set[r];
return r;
}
合并 Θ(1)
merge2(a, b)
{
if (a<b)
set[b] = a;
else
set[a] = b;
}
性能有无本质的改进?如何避免最坏情况呢?
优化--避免最坏情况
效果:任意顺序的合并操作以后,包含k个节点的树的最大高度不超过lgk
优化后算法及效率:
查找 Θ(N)
find2(x)
{
r = x;
while (set[r] != r)
r = set[r];
return r;
}
合并 Θ(1)
merge3(a,b)
{
if (height(a) == height(b)) {
height(a) = height(a) + ;
set[b] = a;
} else if (height(a) < height(b)) {
set[a] = b;
} else {
set[b] = a;
}
}
进一步优化--路径压缩
- 第一步,找到根结点
- 第二步,修改查找路径上的所有节点,将它们都指向根结点
带路径压缩的查找算法:
find3(x)
{
r = x;
while (set[r] != r) //循环结束,则找到根节点
r = set[r];
i = x;
while (i != r) //本循环修改查找路径中所有节点
{
j = set[i];
set[i] = r;
i = j;
}
}
路径压缩示意图:
编程实践
某省调查城镇交通状况,得到现有城镇道路统计表,表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通(但不一定有直接的道路相连,只要互相间接通过道路可达即可)。问最少还需要建设多少条道路?
典型的并查集题目
#include<stdio.h>
int bin[];
int findx(int x)
{
int r = x;
while(bin[r] != r)
r = bin[r];
return r;
}
void merge(int x, int y)
{
int fx, fy;
fx = findx(x);
fy = findx(y);
if(fx != fy)
bin[fx] = fy;
}
void solve()
{
int n, m, i, x, y, count;
while(scanf("%d", &n), n) {
for(i = ; i <= n; i++)
bin[i] = i;
for(scanf("%d", &m); m > ; m--) {
scanf("%d %d", &x, &y);
merge(x, y);
}
for(count = -, i = ; i <= n; i++) {
if(bin[i] == i)
count++;
}
printf("%d\n", count);
}
}
int main()
{
solve();
return ;
}
算法:
判断图是否连通且无回路
如果待连接的两点如果祖先节点相同,那么就构成回路,不符合
如果不构成回路,但是有多个根节点,也不符合
#include<stdio.h>
#define N 100001
int set[N] = {};
int findx(int x)
{
int r = x;
while(set[r] != r)
r = set[r];
return r;
}
void merge(int x, int y)
{
int fx, fy;
fx = findx(x);
fy = findx(y);
set[fy] = fx;
}
void solve()
{
int flag, sum, i, x, y;
while() {
flag = ;
while(scanf("%d %d", &x, &y) && (x || y)) {
if(x == - && y == -) return;
if(set[x] == ) set[x] = x;
if(set[y] == ) set[y] = y;
if(findx(x) == findx(y)) {
flag = ;
} else if(flag != ) {
merge(x, y);
}
}
for(sum = , i = ; i < N; i++) {
if(set[i] == i)
sum++;
set[i] = ;
}
if(sum > || flag == )
printf("No\n");
else
printf("Yes\n");
}
}
int main()
{
solve();
return ;
}
题目大意:
给你一些操作,P后边输入四个值,分别代表一条线段的起点、终点坐标,
当输入Q时,后边输入一个整形值K,输出第k条线段所在的集合中包含的线段的个数
思路:并查集+计算几何线段相交
当输入P时,判断后边输入的线段的起点和终点时,判断跟之前的线段有没有相交,如果有相交,就merge()合并,
如果输入的是Q时,就打印出当前线段所在集合的个数
#include<stdio.h>
#include<stdbool.h>
#define N 1010
int set[N], num[N];
typedef struct P
{
double x, y;
}point; typedef struct E
{
point a, b;
}edge;
edge e[N]; double min(double a, double b)
{
return a > b ? b : a;
} double max(double a, double b)
{
return a > b ? a : b;
} int find(int x) /*带路径压缩的查找算法*/
{
int r, i, j;
i = r = x;
while(set[r] != r)
r = set[r];
while(i != r) {
j = set[i];
set[i] = r;
i = j;
}
return r;
} void merge(int x, int y)
{
int fx, fy;
fx = find(x);
fy = find(y);
if(fx != fy) {
set[fx] = fy;
num[fy] += num[fx];
}
} /********计算几何(判断线段相交函数)**************/
double xmult(point a, point b, point c) /*大于零代表a,b,c左转*/
{
return (b.x - a.x)*(c.y - a.y) - (b.y - a.y) * (c.x - a.x);
}
bool OnSegment(point a,point b,point c) /* a,b,c共线时有效 */
{
return c.x >= min(a.x,b.x) && c.x <= max(a.x,b.x) && c.y >= min(a.y,b.y) && c.y <= max(a.y,b.y);
}
bool Cross(point a,point b,point c,point d) /* 判断ab 与cd是否相交 */
{
double d1, d2, d3, d4;
d1 = xmult(c,d,a);
d2 = xmult(c,d,b);
d3 = xmult(a,b,c);
d4 = xmult(a,b,d);
if(d1 * d2 < && d3 * d4 < ) return true;
else if(d1 == && OnSegment(c, d, a)) return true;
else if(d2 == && OnSegment(c, d, b)) return true;
else if(d3 == && OnSegment(a, b, c)) return true;
else if(d4 == && OnSegment(a, b, d)) return true;
return false;
}
/**********************/ void solve()
{
int t, k, n, i, j, temp;
char s[];
scanf("%d", &t);
while(t--) {
scanf("%d", &n);
k = ;
for(i = ; i <= n; i++) {
set[i] = i;
num[i] = ;
}
for(i = ; i <= n; i++) {
scanf("%s", s);
if(s[] == 'P') {
k++;
scanf("%lf %lf %lf %lf", &e[k].a.x, &e[k].a.y, &e[k].b.x, &e[k].b.y);
for(j = ; j < k; j++) {
if(find(k) != find(j) && Cross(e[k].a, e[k].b, e[j].a, e[j].b))
merge(k, j);
}
} else if(s[] == 'Q') {
scanf("%d", &temp);
printf("%d\n", num[find(temp)]);
}
}
if(t) printf("\n");
}
} int main()
{
solve();
return ;
}
参考资料:
并查集(Disjoint Set)的更多相关文章
- 【算法导论-36】并查集(Disjoint Set)具体解释
WiKi Disjoint是"不相交"的意思.Disjoint Set高效地支持集合的合并(Union)和集合内元素的查找(Find)两种操作,所以Disjoint Set中文翻译 ...
- 【数据结构】【计算机视觉】并查集(disjoint set)结构介绍
1.简述 在实现多图像无序输入的拼接中,我们先使用surf算法对任意两幅图像进行特征点匹配,每对图像的匹配都有一个置信度confidence参数,来衡量两幅图匹配的可信度,当confidence> ...
- 【算法与数据结构】并查集 Disjoint Set
并查集(Disjoint Set)用来判断已有的数据是否构成环. 在构造图的最小生成树(Minimum Spanning Tree)时,如果采用 Kruskal 算法,每次添加最短路径前,需要先用并查 ...
- 并查集(Disjoint Set Union,DSU)
定义: 并查集是一种用来管理元素分组情况的数据结构. 作用: 查询元素a和元素b是否属于同一组 合并元素a和元素b所在的组 优化方法: 1.路径压缩 2.添加高度属性 拓展延伸: 分组并查集 带权并查 ...
- 编程算法 - 食物链 并查集 代码(C)
食物链 并查集 代码(C) 本文地址: http://blog.csdn.net/caroline_wendy 题目: 有N仅仅动物, 分别编号为1,2,...,N. 全部动物都属于A,B,C中的一种 ...
- 并查集 & 最小生成树详细讲解
并查集 & 最小生成树 并查集 Disjoint Sets 什么是并查集? 并查集,在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将 ...
- 数据结构与算法分析 – Disjoint Set(并查集)
什么是并查集?并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题. 并查集的主要操作1.合并两个不相交集合2.判断两个元素是否属于同一集合 主要操作的解释 ...
- 数据结构 之 并查集(Disjoint Set)
一.并查集的概念: 首先,为了引出并查集,先介绍几个概念: 1.等价关系(Equivalent Relation) 自反性.对称性.传递性. 如果a和b存在等价关系,记 ...
- 并查集(disjoint set)的实现及应用
这里有一篇十分精彩.生动的 并查集详解 (转): "朋友的朋友就是朋友"⇒ 传递性,建立连通关系 disjoint set,并查集(一种集合),也叫不相交集,同时也是一种树型的数据 ...
随机推荐
- No Dialect mapping for JDBC type: -9
由于项目中使用的是hibernate 4.35版本和sqlserver 2008数据库.所以,自定义方言时,需要和老版本做区别: public class MySQLServerDialect ext ...
- AngularJS的学习--TodoMVC的分析
最近一段时间一直在看AngularJS,趁着一点时间总结一下. 官网地址:http://angularjs.org/ 先推荐几个教程 1. AngularJS入门教程 比较基础,是官方Tutorial ...
- eclipse luna 安装 Hadoop 1.2.1 eclipse-plugin
博主最近学习Hadoop 1.2.1,从多个搜索引擎的搜索结果当中汇合得出本文Hadoop 1.2.1 Eclipse-plugin安装过程介绍,如果你是从网上下载hadoop-eclipse-plu ...
- python进阶学习笔记(四)--多线程thread
在使用多线程之前,我们首页要理解什么是进程和线程. 什么是进程? 计算机程序只不过是磁盘中可执行的,二进制(或其它类型)的数据.它们只有在被读取到内存中,被操作系统调用的时候才开始它们的生命期.进程( ...
- 免费下载!Twitter Bootstrap V3 矢量界面素材
Bootstrap 3 Vector UI Kit 包含所有矢量格式的 Twitter Bootstrap 3 界面控制元素.Glyphicons 以及额外的一些界面素材,而且基本的图形元素都切好图了 ...
- Laravel 5 多个视图共享数据的方法
我们都知道模板一般会用到继承,导航栏就是一个很好的例子,但是导航栏的数据如何共享,比如有个导航的文件叫在view/navigation.blade.php 为了简单一点,文件里只有设置了一个变量 {{ ...
- ASP.NET MVC权限验证 封装类
写该权限类主要目地 为了让权限配置更加的灵活,可以根据SQL.json.或者XML的方式来动态进行页面的访问控制,以及没有权限的相关跳转. 使用步骤 1.要建一个全局过滤器 //受权过滤器 publi ...
- LeetCode - 30. Substring with Concatenation of All Words
30. Substring with Concatenation of All Words Problem's Link --------------------------------------- ...
- [水煮 ASP.NET Web API2 方法论](3-4)设置路由可选项
问题 怎么样创建一个路由,不管客户端传不传这个参数,都可以被成功匹配. 解决方案 ASP.NET WEB API 的集中式路由和属性路由都支持路由声明可选参数. 在用集中式路由中可以通过 RouteP ...
- C#调用webservice 时如何传递实体对象
在webservice端公开一个实体类,然后实例化,赋值,然后再给到webservice,可以实现,但是,即使调用端和service端的实体类完全一致,你也要重新实例化service端的,重新赋值,将 ...