定义

在一幅无向图 $G=(V,E)$ 中，$(u, v)$ 为连接顶点 $u$ 和顶点 $v$ 的边，$w(u,v)$ 为边的权重，若存在边的子集 $T\subseteq E$ 且 $(V,T)$ 为树，使得

\[w(T)=\sum_{(u,v)\in T}w(u,v) \]

最小，这称 $T$ 为图 $G$ 的最小生成树。

说的通俗点，最小生成树就是带权无向图中权值和最小的树。下图中黑色边所标识的就是一棵最小生成树（图片来自《算法第四版》），对于权值各不相同的连通图来说最小生成树只会有一棵：

带权图的实现

在《如何在 Java 中实现无向图》中我们使用邻接表数组实现了无向图，其中邻接表上的每个节点的数据域只是一个整数，代表着一个顶点。为了方便最小生成树的迭代，我们将数据域换成 Edge 实例。Edge 有三个成员：顶点 v、顶点 w 和权重 weight，为了比较每一条边的权重，需要实现 Comparable 接口。代码如下所示：

package com.zhiyiyo.graph;

/**

 * 图中的边

 */

public class Edge implements Comparable<Edge> {

    private final int v, w;

    private final double weight;

    public Edge(int v, int w, double weight) {

        this.v = v;

        this.w = w;

        this.weight = weight;

    }

    /**

     * 返回边中的一个顶点

     */

    int either() {

        return v;

    }

    /**

     * 返回边中的拎一个顶点

     *

     * @param v 顶点 v

     * @return 另一个顶点

     */

    int another(int v) {

        if (this.v == v) {

            return w;

        } else if (w == v) {

            return this.v;

        } else {

            throw new RuntimeException("边中不存在该顶点");

        }

    }

    public double getWeight() {

        return weight;

    }

    @Override

    public String toString() {

        return String.format("Edge{%d-%d %f}", v, w, weight);

    }

    @Override

    public int compareTo(Edge edge) {

        return Double.compare(weight, edge.weight);

    }

}

之后只要照猫画虎，将 LinkGraph 的泛型从 Integer 换成 Edge 就行了：

package com.zhiyiyo.graph;

import com.zhiyiyo.collection.stack.LinkStack;

import com.zhiyiyo.collection.stack.Stack;

/**

 * 带权无向图

 */

public class WeightedGraph {

    private final int V;

    protected int E;

    protected LinkStack<Edge>[] adj;

    public WeightedGraph(int V) {

        this.V = V;

        adj = (LinkStack<Edge>[]) new LinkStack[V];

        for (int i = 0; i < V; i++) {

            adj[i] = new LinkStack<>();

        }

    }

    public int V() {

        return V;

    }

    public int E() {

        return E;

    }

    public void addEdge(Edge edge) {

        int v = edge.either();

        int w = edge.another(v);

        adj[v].push(edge);

        adj[w].push(edge);

        E++;

    }

    public Iterable<Edge> adj(int v) {

        return adj[v];

    }

    /**

     * 获取所有边

     */

    public Iterable<Edge> edges() {

        Stack<Edge> edges = new LinkStack<>();

        for (int v = 0; v < V; ++v) {

            for (Edge edge : adj(v)) {

                if (edge.another(v) > v) {

                    edges.push(edge);

                }

            }

        }

        return edges;

    }

}

同时给出最小生成树的 API：

package com.zhiyiyo.graph;

/**

 * 最小生成树

 */

public interface MST {

    /**

     * 获取最小生成树中的所有边

     */

    Iterable<Edge> edges();

    /**

     * 获取最小生成树的权重

     */

    double weight();

}

Kruskal 算法

假设 $E$ 是图 $G$ 中所有边的集合，$T$ 是最小生成树的边集合，kruskal 算法的思想是每次从 $E$ 中弹出权值最小的边 $e_m$，如果 $e_m$ 不会和 $T$ 中的边构成环，就将其加入 $T$ 中，直到 $|T|=|V|-1$ 也就是 $T$ 中边的个数是图 $G$ 的顶点个数 -1 时，就得到了最小生成树。

对于上一幅图，使用 kruskal 算法得到最小生成树的过程如下图所示：

首先将 $E$ 中最小的边 0-7 弹出并加到 $T$ 中，此时的 $E$ 中最小边为 2-3，虽然 2-3 和 0-7 无法构成连通图，但是没关系，只要贪心地将其加入 $T$ 中即可，因为后续其他边的添加总会将二者连通起来。接着按照权值的升序依次把边 1-7、0-2、5-7 加到 $T$ 中，直到碰到边 1-3，如果把 1-3 加入 $T$ 中，就会出现环 1-3-2-0-7-1，所以直接将 1-3 舍弃，1-5、2-7 也同理被丢弃掉。由于边 4-5 不会在 $T$ 中构成环，所以将其加入 $T$。重复上述步骤，直到 $|T|=|V|-1$。

上述过程中有两个影响性能的地方，一个是找出 $E$ 中权值最小的边 $e_m$，一个是判断将 $e_m$ 加到 $T$ 中是否会出现环。

二叉堆

二叉堆是一棵完全二叉树，且每个父节点总是大于等于（最大堆）或者小于等于（最小堆）他的子节点。《算法第四版》中给出了使用数组存储的最大堆的结构，其中数组下标为 0 的地方不存储元素，假设下标为 $i$ 出存放的是父节点，那么 $2i$ 和 $2i+1$ 处就是子节点：

由于最小堆的堆顶节点总是最小的，所以只需将 $E$ 变为一个最小堆，每次取出堆顶的元素即可，时间复杂度为 $O(\log N)$。下面来看下如何实现最小堆。

API

对于一个二叉堆，我们关心以下操作：

package com.zhiyiyo.collection.queue;

public interface PriorQueue<T extends Comparable<T>> {

    /**

     * 向堆中插入一个元素

     * @param item 插入的元素

     */

    void insert(T item);

    /**

     * 弹出堆顶的元素

     * @return 堆顶元素

     */

    T pop();

    /**

     * 获取堆中的元素个数

     */

    int size();

    /**

     * 堆是否为空

     */

    boolean isEmpty();

}

插入

为了保证二叉堆是一棵完全二叉树，每次都将新节点插到数组的末尾，也就是二叉树的最后一个节点。如下图所示，假设插入的节点为 A，它的父节点为 P，兄弟节点为 S，由于 P > A，这就打破了二叉堆的有序性，所以需要对堆进行调整。具体流程就是将兄弟节点中的较小者（A）选为父节点，而先前的父节点 P 则退位变为子节点。如果此时 A 的父节点小于 A，则无需继续调整。但是下图中只交换了 A、P 之后还是没将二叉树调整为堆有序状态，因为父节点 D > A，接着将兄弟节点中较小的 A 变为父节点，而 D 则变成 A 的子节点，至此完成最小堆的调整。

上述过程的代码如下所示，为了保证后续插入操作，每当数组满员时就对其进行扩容操作：

package com.zhiyiyo.collection.queue;

import java.util.Arrays;

public class MinPriorQueue<T extends Comparable<T>> implements PriorQueue<T>{

    private T[] array;

    private int N;

    public MinPriorQueue() {

        this(3);

    }

    public MinPriorQueue(int maxSize) {

        array = (T[]) new Comparable[maxSize + 1];

    }

    @Override

    public boolean isEmpty() {

        return N == 0;

    }

    @Override

    public int size() {

        return N;

    }

    @Override

    public void insert(T item) {

        array[++N] = item;

        swim(N);

        if (N == array.length - 1) resize(1 + 2 * N);

    }

    /**

     * 元素上浮

     *

     * @param k 元素的索引

     */

    private void swim(int k) {

        while (k > 1 && less(k, k / 2)) {

            swap(k, k / 2);

            k /= 2;

        }

    }

    private void swap(int a, int b) {

        T tmp = array[a];

        array[a] = array[b];

        array[b] = tmp;

    }

    private boolean less(int a, int b) {

        return array[a].compareTo(array[b]) < 0;

    }

    private void resize(int size) {

        array = Arrays.copyOf(array, size);

    }

}

删除最小元素

假设我们需要删除下图中的 A 元素，这时候就需要将 A 和最小堆的最后一个元素 P 交换位置，并将数组的最后一个元素置为 null，使得 A 的引用次数变为 0，能被垃圾回收机制自动回收掉。交换之后最小堆的有序性被破坏了，因为父节点 P > 子节点 D，这时候和插入元素的操作一样，将较小的子节点和父节点交换位置，使得较大的父节点能够下沉，而较小的子节点上位，这个过程持续到没有子节点被 P 更小为止。

实现代码如下：

@Override

public T pop() {

    T item = array[1];

    swap(1, N);

    array[N--] = null;

    sink(1);

    if (N < (array.length - 1) / 4) resize((array.length - 1) / 2);

    return item;

}

/**

 * 元素下沉

 *

 * @param k 元素的索引

 */

private void sink(int k) {

    while (2 * k <= N) {

        int j = 2 * k;

        // 检查是否有两个子节点

        if (j < N && less(j + 1, j)) j++;

        if (less(k, j)) break;

        swap(k, j);

        k = j;

    }

}

并查集

假设 $T$ 中的顶点的集合为 $V'$，则有图 $G'=(V', T)$。我们可以将 $G'$ 划分为 $n$ 个连通分量，每个连通分量有一个标识 $id\in [0, n-1]$。要想判断将边 $e_m$ 加入 $T$ 后是否会构成环，只需判断 $e_m$ 的两个顶点是都属于同一个连通分量即可。

判断是否连通

由于每个连通分量都不存在环，可以看作一棵小树，所以可以用一个数组 int[] ids 的索引表示树中的节点（图中的顶点），而索引处的元素值为父节点的索引值，数组中 ids[i] == i 的位置就是每棵树的根节点，i 就是这个连通分量的标识。而我们想要知道两个节点之间是否连通，只需判断他们所属的树的根节点是否相同即可。

假设从树底的叶节点 6 出发，一路向上直到树顶 1，中间需要经过 5 和 0 两个节点，如果节点 6 的根节点查询得比较频繁，那么这种查找效率是比较低的。由于我们只需知道根节点是谁即可，树的结构无关紧要，那么为何不想个办法把节点 5、6 直接挂到根节点 1，这样只要一步就能知道根节点。实现这种想法的的方式就是路径压缩：当从节点 6 走到父节点 5 时，就将节点 6 挂到节点 5 的父节点 0 上；而从节点 0 走到根节点 1 时，就将子节点 6 和 5 挂到根节点 1 下，树高被压缩为 1。

实现上述过程的代码如下所示：

package com.zhiyiyo.collection.tree;

public class UnionFind {

    private int[] ids;

    private int[] ranks;    // 每棵树的高度

    private int N;          // 树的数量

    public UnionFind(int N) {

        this.N = N;

        ids = new int[N];

        ranks = new int[N];

        for (int i = 0; i < N; i++) {

            ids[i] = i;

            ranks[i] = 1;

        }

    }

    /**

     * 获取连通分量个数

     *

     * @return 连通分量个数

     */

    public int count() {

        return N;

    }

    /**

     * 获得连通分量的 id

     *

     * @param p 触点 id

     * @return 连通分量 id

     */

    public int find(int p) {

        while (p != ids[p]) {

            ids[p] = ids[ids[p]];   // 路径压缩

            p = ids[p];

        }

        return p;

    }

    /**

     * 判断两个触点是否连通

     *

     * @param p 触点 p 的 id

     * @param q 触点 q 的 id

     * @return 是否连通

     */

    public boolean isConnected(int p, int q) {

        return find(p) == find(q);

    }

}

合并连通分量

我们将 $E$ 中的 $e_m$ 添加到 $T$ 中时，$e_m$ 的两个节点肯定分属于两个连通分量，加入 $T$ 之后就需要将这两个分量合并，也就是将两棵小树合并为一颗大树。假设两棵树的高度分别为 $h_1$ 和 $h_2$，如果直接将一颗树的根节点接到另一棵树的叶节点上，会导致新树高度为 $h_1+h_2$，降低寻找根节点的效率。解决方式是按秩归并，将矮树的根节点接到高树的根节点上，会出现两种情况：

如果 $h_1 \neq h_2$，新树高度会是 $\max\{h_1, h_2\}$
如果 $h_1=h_2=c$，新树高度会是 $c+1$

上述过程的代码如下所示：

/**

 * 如果两个触点不处于同一个连通分量中，则连接两个触点

 *

 * @param p 触点 p 的 id

 * @param q 触点 q 的 id

 */

public void union(int p, int q) {

    int pId = find(p);

    int qId = find(q);

    if (qId == pId) return;

    // 将小树并到大树

    if (ranks[qId] > ranks[pId]) {

        ids[pId] = qId;

    } else if (ranks[qId] < ranks[pId]) {

        ids[qId] = pId;

    } else {

        ids[qId] = pId;

        ranks[pId]++;

    }

    N--;

}

实现算法

实现 kruskal 算法时，先将所有边加入最小堆中，每次取出堆顶的元素 $e_m$，然后使用并查集判断边的两个顶点是否连通，如果不连通就将 $e_m$ 加入 $T$，重复这个过程直至 $|T|=|V|-1$，时间复杂度为 $O(|E|\log |E|)$。

package com.zhiyiyo.graph;

import com.zhiyiyo.collection.queue.LinkQueue;

import com.zhiyiyo.collection.queue.MinPriorQueue;

import com.zhiyiyo.collection.queue.Queue;

import com.zhiyiyo.collection.tree.UnionFind;

import java.util.stream.Stream;

import java.util.stream.StreamSupport;

public class KruskalMST implements MST {

    private Queue<Edge> mst;

    public KruskalMST(WeightedGraph graph) {

        mst = new LinkQueue<>();

        UnionFind uf = new UnionFind(graph.V());

        MinPriorQueue<Edge> pq = new MinPriorQueue<>();

        for (Edge e : graph.edges()) {

            pq.insert(e);

        }

        while (mst.size() < graph.V() - 1 && !pq.isEmpty()) {

            Edge edge = pq.pop();

            int v = edge.either();

            int w = edge.another(v);

            if (!uf.isConnected(v, w)) {

                mst.enqueue(edge);

                uf.union(v, w);

            }

        }

    }

    @Override

    public Iterable<Edge> edges() {

        return mst;

    }

    @Override

    public double weight() {

        Stream<Edge> stream = StreamSupport.stream(mst.spliterator(), false);

        return stream.map(Edge::getWeight).reduce(0d, Double::sum);

    }

}

Prim 算法

Prim 算法的思想是初始化最小生成树为一个根节点 0，然后将根节点的所有邻边加入最小堆中，从最小堆中弹出最小的边 $e_m$，如果 $e_m$ 不会使得树中出现环，将将其并入树中。每当有新的节点 $v$ 被并入树中时，就得将 $v$ 的所有邻边加入最小堆中。重复上述过程直到 $|T|=|V|-1$，时间复杂度为 $O(|E|\log|E|)$。代码如下所示：

package com.zhiyiyo.graph;

import com.zhiyiyo.collection.queue.LinkQueue;

import com.zhiyiyo.collection.queue.MinPriorQueue;

import com.zhiyiyo.collection.queue.Queue;

import java.util.stream.Stream;

import java.util.stream.StreamSupport;

/**

 * 延时版本 Prim 算法

 */

public class PrimMST implements MST {

    private boolean[] marked;

    private MinPriorQueue<Edge> pq;

    private Queue<Edge> mst;

    public LazyPrimMST(WeightedGraph graph) {

        marked = new boolean[graph.V()];

        pq = new MinPriorQueue<>();

        mst = new LinkQueue<>();

        mark(graph, 0);

        while (mst.size() < graph.V() - 1 && !pq.isEmpty()) {

            Edge edge = pq.pop();

            int v = edge.either();

            int w = edge.another(v);

            // 构成环则舍弃

            if (marked[v] && marked[w]) continue;

            mst.enqueue(edge);

            if (!marked[v]) mark(graph, v);

            else if (!marked[w]) mark(graph, w);

        }

    }

    private void mark(WeightedGraph graph, int v) {

        marked[v] = true;

        for (Edge edge : graph.adj(v)) {

            if (!marked[edge.another(v)]) {

                pq.insert(edge);

            }

        }

    }

    @Override

    public Iterable<Edge> edges() {

        return mst;

    }

    @Override

    public double weight() {

        Stream<Edge> stream = StreamSupport.stream(mst.spliterator(), false);

        return stream.map(Edge::getWeight).reduce(0d, Double::sum);

    }

}

由于每次都是把新节点的所有邻边都加到了最小堆中，会引入许多无用的边，所以《算法第四版》中给出了使用索引优先队列实现的即时版 Prim 算法，时间复杂度能达到 $O(|E|\log |V|)$，但是这里写不下了，大家可以自行查阅，以上~~

如何在 Java 中实现最小生成树算法的更多相关文章

如何在 Java 中实现 Dijkstra 最短路算法
定义最短路问题的定义为:设 $G=(V,E)$ 为连通图,图中各边 $(v_i,v_j)$ 有权 $l_{ij}$ ($l_{ij}=\infty$ 表示 $v_i,v_j$ 间 ...
如何在 Java 中实现无向环和有向环的检测
无向环一个含有环的无向图如下所示,其中有两个环,分别是 0-2-1-0 和 2-3-4-2: 要检测无向图中的环,可以使用深度优先搜索.假设从顶点 0 出发,再走到相邻的顶点 2,接着走到顶点 2 ...
Java中的经典算法之冒泡排序(Bubble Sort)
Java中的经典算法之冒泡排序(Bubble Sort) 神话丿小王子的博客主页原理:比较两个相邻的元素,将值大的元素交换至右端. 思路:依次比较相邻的两个数,将小数放在前面,大数放在后面.即在第一 ...
如何在JAVA中实现一个固定最大size的hashMap
如何在JAVA中实现一个固定最大size的hashMap 利用LinkedHashMap的removeEldestEntry方法,重载此方法使得这个map可以增长到最大size,之后每插入一条新的记录 ...
Java中的查找算法之顺序查找(Sequential Search)
Java中的查找算法之顺序查找(Sequential Search) 神话丿小王子的博客主页 a) 原理:顺序查找就是按顺序从头到尾依次往下查找,找到数据,则提前结束查找,找不到便一直查找下去,直到数 ...
Java中的经典算法之选择排序（SelectionSort）
Java中的经典算法之选择排序(SelectionSort) 神话丿小王子的博客主页 a) 原理:每一趟从待排序的记录中选出最小的元素,顺序放在已排好序的序列最后,直到全部记录排序完毕.也就是:每一趟 ...
如何在java中使用sikuli进行自动化测试
很早之前写过一篇介绍sikuli的文章.本文简单介绍如何在java中使用sikuli进自动化测试. 图形脚本语言sikuli sikuli IDE可以完成常见的单击.右击.移动到.拖动等鼠标操作,ja ...
Java中的排序算法（2）
Java中的排序算法(2) * 快速排序 * 快速排序使用分治法(Divide and conquer)策略来把一个序列(list)分为两个子序列(sub-lists). * 步骤为: * 1. 从数 ...
如何在Java中调用Python代码
有时候,我们会碰到这样的问题:与A同学合作写代码,A同学只会写Python,而不会Java, 而你只会写Java并不擅长Python,并且发现难以用Java来重写对方的代码,这时,就不得不想方设法“调 ...

随机推荐

python学习之matplotlib实战2
import numpy as np import matplotlib.pyplot as plt def main(): #scatter fig = plt.figure() ax = fig. ...
关于深搜dps
哈哈,我又来了! 但是!今天我又带来了让人开心到窒息的 ----深搜dps 其实关于深搜,概念没啥可讲的,总结一句话概括就是:一直往下搜,直到满足条件的,再回来,沿着下一条路搜,直到把路全走完为止.. ...
解决HTML中文乱码问题
将HTML代码复制到一个新建的记事本然后在记事本里面的操作另存为选择utf-8编码新的那个html文本打开中文已显示正常
[bzoj1791][ioi2008]Island 岛屿(基环树、树的直径)
[bzoj1791][ioi2008]Island 岛屿(基环树.树的直径) bzoj luogu 题意可能会很绕一句话:基环树的直径. 求直径: 对于环上每一个点记录其向它的子树最长路径为$dp_ ...
java面试-四维图新
1.给出至少三种排序方式,并写出详细实现思路. /** * 快速排序 * @param arr * @param low * @param high */ public static void qui ...
Dubbo 和 Spring Cloud 的区别？
根据微服务架构在各方面的要素,看看 Spring Cloud 和 Dubbo 都提供了哪些支持. Dubbo Spring Cloud 服务注册中心 Zookeep er Spring Cloud ...
Semaphore 有什么作用？
Semaphore 就是一个信号量,它的作用是限制某段代码块的并发数.Semaphore 有一个构造函数,可以传入一个 int 型整数 n,表示某段代码最多只有 n 个线程可以访问,如果超出了 n, ...
CyclicBarrier 和 CountDownLatch 的区别 ?
1.CountDownLatch 简单的说就是一个线程等待,直到他所等待的其他线程都执行完成并且调用 countDown()方法发出通知后,当前线程才可以继续执行. 2.cyclicBarrier ...
面试问题之C++语言：C与C++的区别
C是C++的基础,C++语言和C语言在很多方面是兼容的. C是结构化语言,它的重点在于算法和数据结构.C程序的设计首要考虑的是如何通过一个过程,对输入(或环境条件)进行运算处理得到输出或实现过程(事务 ...
转：master公式(主方法)
master公式(也称主方法)是利用分治策略来解决问题经常使用的时间复杂度的分析方法,(补充:分治策略的递归解法还有两个常用的方法叫做代入法和递归树法),众所众知,分治策略中使用递归来求解问题分为三步 ...

如何在 Java 中实现最小生成树算法

定义