0.二分图

二分图的概念

二分图又称作二部图,是图论中的一种特殊模型。
设G=(V, E)是一个无向图。如果顶点集V可分割为两个互不相交的子集X和Y,并且图中每条边连接的两个顶点一个在X中,另一个在Y中,则称图G为二分图。
可以得到线上的driver与order之间的匹配关系既是一个二分图。

二分图的判定

无向图G为二分图的充分必要条件是,G至少有两个顶点,且其所有回路的长度均为偶数。
判断无向连通图是不是二分图,可以使用深度优先遍历算法(又名交叉染色法)。
下面着重介绍下交叉染色法的定义与原理
首先任意取出一个顶点进行染色,和该节点相邻的点有三种情况:
       1.如果节点没有染过色,就染上与它相反的颜色,推入队列,
       2.如果节点染过色且相反,忽视掉,
       3.如果节点染过色且与父节点相同,证明不是二分图,return

二分图博客推荐

交叉染色法博客推荐:交叉染色法判断二分图
另外附上二分图的性质博客:二分图的一些性质

1.KM算法初步

KM算法全称是Kuhn-Munkras,是这两个人在1957年提出的,有趣的是,匈牙利算法是在1965年提出的。 

增广路径

增广路径定义:
若P是图G中一条连通两个未匹配顶点的路径,并且属于M的边和不属于M的边(即已匹配和待匹配的边)在P上交替出现,则称P为相对于M的一条增广路径
(举例来说,有A、B集合,增广路由A中一个点通向B中一个点,再由B中这个点通向A中一个点……交替进行)
增广路径有如下特性: 
1. 有奇数条边 
2. 起点在二分图的X边,终点在二分图的Y边 
3. 路径上的点一定是一个在X边,一个在Y边,交错出现。 
4. 整条路径上没有重复的点 
5. 起点和终点都是目前还没有配对的点,其他的点都已经出现在匹配子图中 
6. 路径上的所有第奇数条边都是目前还没有进入目前的匹配子图的边,而所有第偶数条边都已经进入目前的匹配子图。奇数边比偶数边多一条边 
7. 于是当我们把所有第奇数条边都加到匹配子图并把条偶数条边都删除,匹配数增加了1.
 
例如下图,蓝色的是当前的匹配子图,红色表示未匹配的路径,目前只有边x0y0,然后通过x1找到了增广路径:x1y0->y0x0->x0y2 

增广路径有两种寻径方法,一个是深搜,一个是宽搜。
例如从x2出发寻找增广路径
  • 如果是深搜,x2找到y0匹配,但发现y0已经被x1匹配了,于是就深入到x1,去为x1找新的匹配节点,结果发现x1没有其他的匹配节点,于是匹配失败,x2接着找y1,发现y1可以匹配,于是就找到了新的增广路径。
  • 如果是宽搜,x1找到y0节点的时候,由于不能马上得到一个合法的匹配,于是将它做为候选项放入队列中,并接着找y1,由于y1已经匹配,于是匹配成功返回了。
相对来说,深搜要容易理解些,其栈可以由递归过程来维护,而宽搜则需要自己维护一个队列,并对一路过来的路线自己做标记,实现起来比较麻烦。

匈牙利算法

匈牙利算法,用于求二分图的最大匹配。何为最大匹配?假设每条边有权值,那么一定会存在一个最大权值的匹配情况。

匈牙利算法步骤

算法根据一定的规则选择二分图的边加入匹配子图中,其基本模式为:
1.初始化匹配子图为空 
2.While 找得到增广路径 
3.Do 把增广路径添加到匹配子图中

匈牙利算法博客推荐

KM深度优先遍历算法,其中附带讲解图可参考博客:趣写算法系列之–匈牙利算法
最大匹配的讲解博客:匈牙利算法(二分图)

KM算法

KM算法,用于求二分图匹配的最佳匹配。何为最佳匹配?就是带权二分图的权值最大的完备匹配称为最佳匹配。 那么何为完备匹配?X部中的每一个顶点都与Y部中的一个顶点匹配,或者Y部中的每一个顶点也与X部中的一个顶点匹配,则该匹配为完备匹配。

KM算法步骤

其算法步骤如下:
1.用邻接矩阵(或其他方法也行啦)来储存图,注意:如果只是想求最大权值匹配而不要求是完全匹配的话,请把各个不相连的边的权值设置为0。
2.运用贪心算法初始化标杆。
3.运用匈牙利算法找到完备匹配。
4.如果找不到,则通过修改标杆,增加一些边。
5.重复3,4的步骤,直到完全匹配时可结束。

KM算法标杆(又名顶标)的引入

二分图最佳匹配还是二分图匹配,所以跟和匈牙利算法思路差不多。
二分图是特殊的网络流,最佳匹配相当于求最大(小)费用最大流,所以FF算法(全名Ford-Fulkerson算法)也能实现。
  • 所以我们可以把这匈牙利算法和FF算法结合起来。这就是KM算法的思路了:尽量找最大的边进行连边,如果不能则换一条较大的。
    • FF算法里面,我们每次是找最长(短)路进行通流,所以二分图匹配里面我们也按照FF算法找最大边进行连边!
    • 但是遇到某个点被匹配了两次怎么办?那就用匈牙利算法进行更改匹配!
  • 所以,根据KM算法的思路,我们一开始要对边权值最大的进行连线。
  • 那问题就来了,我们如何让计算机知道该点对应的权值最大的边是哪一条?或许我们可以通过某种方式记录边的另一端点,但是呢,后面还要涉及改边,又要记录边权值总和,而这个记录端点方法似乎有点麻烦。
    • 于是KM采用了一种十分巧妙的办法(也是KM算法思想的精髓):添加标杆(顶标)
添加标杆(顶标)流程:
  • 我们对左边每个点Xi和右边每个点Yi添加标杆Cx和Cy。其中我们要满足Cx+Cy>=w[x][y](w[x][y]即为点Xi、Yi之间的边权值)
  • 对于一开始的初始化,我们对于每个点分别进行如下操作:Cx=max(w[x][y]);  Cy=0;
添加顶标之前的二分图:
                
添加顶标之后的二分图:
 

KM流程详解

  • 初始化可行顶标的值 (设定lx,ly的初始值)
  • 用匈牙利算法寻找相等子图的完备匹配
  • 若未找到增广路则修改可行顶标的值
  • 重复(2)(3)直到找到相等子图的完备匹配为止
使用上图的例子,采用匈牙利算法进行连边操作,将最大边进行连线。所以原来判断是否有边的条件w[x][y]==0换成了 Cx+Cy==w[x][y]
  • 于是乎我们连了AD,形成一个新的二分图(我们下面叫它二分子图好了)
  • 接下来就尴尬了,计算机接下来要连B点的BD,但是D点已经和A点连了,怎么办呢???
    • 根据匈牙利算法,我们做的是将A点与其他点进行连线,但此时的子图里“不存在”与A点相连的其他边,怎么办呢???
      • 为此,我们就需要加上这些边!很明显,我们添边,自然要加上不在子图中边权最大的边,也就是和子图里这个边权值差最小的边。
        • 于是,我们再一度引入了一变量d,d=min{Cx[i]+Cy[j]-w[i][j]},其中,在这个题目里Cx[i]指的是A的标杆,Cy[j]是除D点(即已连点)以外的点的标杆。
          • 随后,对于原先存在于子图的边AD,我们将A的标杆Cx[i]减去d,D的标杆Cy[d]加上d。
            • 这样,这就保证了原先存在AD边保留在了子图中,并且把不在子图的最大权值的与A点相连的边AE添加到了子图。
            • 因为计算机判断一条边是否在该子图的条件是其两端的顶点的标杆满足Cx+Cy==w[x][y]
              • 对于原先的边,我们对左端点的标杆减去了d,对右端点的标杆加上了d,所以最终的结果还是不变,仍然是w[x][y]。
              • 对于我们要添加的边,我们对于左端点减去了d,即Cx[i]=Cx[i]-d;为方便表示我们把更改后的的Cx[i]视为Cz[i],即Cz[i]=Cx[i]-d;
                • 因为Cz[i]=Cx[i]-d;d=Cx[i]+Cy[j]-w[i][j];
                • 把d代入左式可得Cz[i]=Cx[i]-(Cx[i]+Cy[j]-w[i][j]);
                • 化简得Cz[i]+Cy[j]=w[i][j];
                • 满足了要求!即添加了新的边。
    • 重复进行上述流程。(匈牙利算法以及FF算法的结合)

KM算法博客推荐

顶标内容讲的很好:KM算法
松弛度内容讲的比较好:二分图的最佳完美匹配——KM算法
匈牙利算法和FF算法结合得到KM算法讲的很详细:二分图匹配之最佳匹配——KM算法
最佳讲解博客推荐:我对KM算法的理解

2.DFS版本的KM算法

/*==================================================*\
| 二分图匹配(匈牙利算法DFS 实现)
| INIT: graph[][]邻接矩阵;
| CALL: res = dfsHungarian ();
| 优点:实现简洁容易理解,适用于稠密图,DFS 找增广路快。
| 找一条增广路的复杂度为O(E),最多找V条增广路,故时间复杂度为O(VE)
| 算法简述:
| 从二分图中找出一条路径来,让路径的起点和终点都是还没有匹配过的点,
| 并且路径经过的连线是一条没被匹配、一条已经匹配过,再下一条又没匹配这样交替地出现。
| 找到这样的路径后,显然路径里没被匹配的连线比已经匹配了的连线多一条,
| 于是修改匹配图,把路径里所有匹配过的连线去掉匹配关系,把没有匹配的连线变成匹配的。
| 这样匹配数就比原来多1个。不断执行上述操作,直到找不到这样的路径为止。
\*==================================================*/
#include<iostream>
#include<memory.h>
using namespace std; #define MAXN 10
int graph[MAXN][MAXN];
int match[MAXN];
int visitX[MAXN], visitY[MAXN];
int nx, ny; bool findPath( int u )
{
visitX[u] = ;
for( int v=; v<ny; v++ )
{
if( !visitY[v] && graph[u][v] )
{
visitY[v] = ;
if( match[v] == - //第一次,用到了短路计算,否则findPath(-1)会出问题
|| findPath(match[v]) )//这里就表示深度优先遍历 不撞南山头不回 不见黄河心不死
{
match[v] = u;
return true;
}
}
}
return false;
} int dfsHungarian()
{
int res = ;
memset( match, -, sizeof(match) );
for( int i=; i<nx; i++ )
{
memset( visitX, , sizeof(visitX) );
memset( visitY, , sizeof(visitY) );
if( findPath(i) )
res++;
}
return res;
}

3.BFS版本的KM算法

/*==================================================*\
| 二分图匹配(匈牙利算法BFS 实现)
| INIT: graph[][]邻接矩阵;
| CALL: res = bfsHungarian ();
| 优点:适用于稀疏二分图,边较少,增广路较短。
| 匈牙利算法的理论复杂度是O(VE)
\*==================================================*/
#include<iostream>
#include<memory.h>
using namespace std; #define MAXN 10
int graph[MAXN][MAXN];
//在bfs中,增广路径的搜索是一层一层展开的,所以必须通过prevX来记录上一层的顶点
//chkY用于标记某个Y顶点是否被目前的X顶点访问尝试过。
int matchX[MAXN], matchY[MAXN], prevX[MAXN], chkY[MAXN];
int queue[MAXN];
int nx, ny; int bfsHungarian()
{
int res = ;
int qs, qe;
memset( matchX, -, sizeof(matchX) );
memset( matchY, -, sizeof(matchY) );
memset( chkY, -, sizeof(chkY) ); for( int i=; i<nx; i++ )
{
if( matchX[i] == - ) //如果该X顶点未找到匹配点,将其放入队列。
{
qs = qe = ;
queue[qe++] = i;
prevX[i] = -; //并且标记,它是路径的起点
bool flag = ; while( qs<qe && !flag )
{
int u = queue[qs];
for( int v=; v<ny&&!flag; v++ )
{
if( graph[u][v] && chkY[v]!=i ) //如果该节点与u有边且未被访问过
{
chkY[v] = i; //标记且将它的前一个顶点放入队列中,也就是下次可能尝试这个顶点看能否为它找到新的节点
queue[qe++] = matchY[v];
if( matchY[v] >= )
prevX[matchY[v]] = u;
else //到达了增广路径的最后一站
{
flag = ;
int d=u, e=v;
while( d!=- ) //一路通过prevX找到路径的起点
{
int t = matchX[d];
matchX[d] = e;
matchY[e] = d;
d = prevX[d];
e = t;
}
}
}
}
qs++;
}
if( matchX[i] != - )
res++;
}
}
return res;
}

【原创】我的KM算法详解的更多相关文章

  1. KM算法详解[转]

    KM算法详解 原帖链接:http://www.cnblogs.com/zpfbuaa/p/7218607.html#_label0 阅读目录 二分图博客推荐 匈牙利算法步骤 匈牙利算法博客推荐 KM算 ...

  2. KM算法 详解+模板

    先说KM算法求二分图的最佳匹配思想,再详讲KM的实现.[KM算法求二分图的最佳匹配思想] 对于具有二部划分( V1, V2 )的加权完全二分图,其中 V1= { x1, x2, x3, ... , x ...

  3. KM算法详解+模板

    http://www.cnblogs.com/wenruo/p/5264235.html KM算法用来求二分图最大权完美匹配. 本文配合该博文服用更佳:趣写算法系列之--匈牙利算法 现在有N男N女,男 ...

  4. 【原创】RMQ - ST算法详解

    ST算法: ID数组下标: 1   2   3   4   5   6   7   8   9    ID数组元素: 5   7   3   1   4   8   2   9   8 1.ST算法作 ...

  5. (原创)白话KMP算法详解

    引子:BF暴力算法 KMP算法知名度相当高,燃鹅其理解难度以及代码实现对于初学数据结构和算法的同学并不友好,经过两天的总结,详细总结KMP算法如下: 初学串的模式匹配时,我们都会接触到,或者说应该能想 ...

  6. KMP算法详解(转自中学生OI写的。。ORZ!)

    KMP算法详解 如果机房马上要关门了,或者你急着要和MM约会,请直接跳到第六个自然段. 我们这里说的KMP不是拿来放电影的(虽然我很喜欢这个软件),而是一种算法.KMP算法是拿来处理字符串匹配的.换句 ...

  7. FloodFill算法详解及应用

    啥是 FloodFill 算法呢,最直接的一个应用就是「颜色填充」,就是 Windows 绘画本中那个小油漆桶的标志,可以把一块被圈起来的区域全部染色. 这种算法思想还在许多其他地方有应用.比如说扫雷 ...

  8. BM算法  Boyer-Moore高质量实现代码详解与算法详解

    Boyer-Moore高质量实现代码详解与算法详解 鉴于我见到对算法本身分析非常透彻的文章以及实现的非常精巧的文章,所以就转载了,本文的贡献在于将两者结合起来,方便大家了解代码实现! 算法详解转自:h ...

  9. kmp算法详解

    转自:http://blog.csdn.net/ddupd/article/details/19899263 KMP算法详解 KMP算法简介: KMP算法是一种高效的字符串匹配算法,关于字符串匹配最简 ...

随机推荐

  1. 分享一个整理Mac储存空间的软件,有效清理xcode的垃圾

    苹果的电脑还是比windows的要好,我这台用了3年时间,作为编程工作天天用,现在愣是一点儿也没有卡顿,如果换作是windows的电脑,我敢保证肯定是卡成狗,相信做编程的你肯定少补了一台mac. ma ...

  2. vim8.0模式详解

    pattern pattern.txt For Vim version 8.0. 最近更新: 2017年8月 VIM 参考手册 by Bram Moolenaar 译者: lang2 http://v ...

  3. iOS:类似于网易云音乐的刷新条目显示弹框

    一.介绍 在app中使用刷新控件或者第三方刷新库是最常见的功能,在请求服务器时,获取数据的过程是处于不可见状态的,那么通过这个刷新状态可以给用户以直观的感受,这是增强用户体验的一个相当好的方法.我个人 ...

  4. 超过 130 个你需要了解的 vim 命令

    从 1970 年开始,vi 和 vim 就成为了程序员最喜爱的文本编辑器之一.5年前,我写了一个问自己名为 “每个程序员都应该知道的 100 个 vim 命令” 这次算是之前那篇文章的改进版,希望你会 ...

  5. C#退出程序,退出任务管理器

    //窗体关闭之前 this.FormClosing += (s, r) => { System.Environment.Exit(0); }; //窗体关闭 this.Closed += (s, ...

  6. 国密SM3算法在linux和windows平台结果不一致问题

    什么是sm3,是一种类似于sha256的哈希算法,是咱们国家的哈希标准算法: 最近在使用sm3算法时,同样的一份数据,调用同样的sm3接口,发现得到的结果是不一样的: 那么在应用过的过程中,如果同样的 ...

  7. Could not parse multipart servlet request; nested exception is org.apache.commons.fileupload.FileUploadBase$IOFileUploadException: Processing of multipart/form-data request failed.

    org.springframework.web.multipart.MultipartException: Could not parse multipart servlet request; nes ...

  8. R语言|数据特征分析

    对数据进行质量分析以后,接下来可通过绘制图表.计算某些特征量等手段进行数据的特征分析. 主要通过分布分析.对比分析.统计量分析.周期性分析.贡献度分析.相关性分析等角度进行展开. 2.1 分布分析 分 ...

  9. 《数据结构-C语言版》(严蔚敏,吴伟民版)课本源码+习题集解析使用说明

    <数据结构-C语言版>(严蔚敏,吴伟民版)课本源码+习题集解析使用说明 先附上文档归类目录: 课本源码合辑  链接☛☛☛ <数据结构>课本源码合辑 习题集全解析  链接☛☛☛  ...

  10. django项目settings.py的基础配置

    一个新的django项目初始需要配置settings.py文件: 1. 项目路径配置 新建一个apps文件夹,把所有的项目都放在apps文件夹下,比如apps下有一个message项目,如果不进行此项 ...