小小c#算法题 - 7 - 堆排序 (Heap Sort)

在讨论堆排序之前，我们先来讨论一下另外一种排序算法——插入排序。插入排序的逻辑相当简单，先遍历一遍数组找到最小值，然后将这个最小值跟第一个元素交换。然后遍历第一个元素之后的n-1个元素，得到这n-1个元素中的最小值，即整个序列的次小值，将其跟第二个元素交换。接下来对后n-2个元素进行相同的操作，直到得到有序序列。

很显然，插入排序的时间复杂度是O(n²)。在n个关键字中选出最小值，至少进行n-1次比较，然而，继续在剩余的n-1个关键字中选择次小值就并非一定要进行n-2次比较，若能利用前n-1次比较所得信息，则可以减少以后各趟选择排序中所用的比较次数。堆排序正是利用了之前比较信息的一种排序算法，从而提高了效率。

鉴于篇幅和编辑的难度，这里不会非常详细的介绍堆排序的细节，如果想了解更多的话，可以看看数据结构的书籍或其他文章。

堆排序是利用堆这种数据结构进行排序的一种算法。堆的定义如下：n个元素序列{k1,k2,...,kn}当且仅当满足以下关系时，称之为堆

情况1：ki <= k(2i) && ki <= K(2i+1)

或

情况2：ki >= k(2i) && ki >= k(2i+1)

满足情况1的我们称之为小顶堆，满足情况2的我们称之为大顶堆。

若将此序列对应的一维数组（即以一维数组作此序列的存储结构）看成一个完全二叉树，则堆的定义表明，完全二叉树中所有终端结点的值均不大于（或不小于）其左右孩子结点的值。由此，堆顶元素必为n个元素序列中的最小值或最大值。

若在输出堆顶的最小值（或最大值）之后，使得剩余n-1个元素的序列又建成一个堆，则得到n个元素中的次小值（或次大值）。如此反复执行，便能得到一个有序序列，这个过程称之为堆排序。

那么现在就需要处理两个问题了：

1. 怎么样由无序序列建成一个堆？

2. 如何在输出堆顶元素之后，调整剩余元素成为一个新的堆？

我们假设我们在使用大顶堆的情况。

首先，我们先考虑问题2，通常把堆顶元素跟最后一个元素交换，这样就把最大值放到了序列的最后。现在我们要调整前n-1个元素成为一个新的堆。现在堆顶元素的左右子树都为堆，则仅需自上至下进行调整即可。首先以堆顶元素和其左、右子树根结点进行比较，将三者中最大的放到堆项：(a)如果堆顶本来就最大，不用交换，并且现在已经是一个堆了，因为左、右子树都是堆，调整可以退出了。(b)如果三者中最大的元素为左右子树根结点中的一个，则要和堆顶结点交换，被交换的子树根结点所在子树被破坏，不再是堆，所以又要进行相同过程的调整，如此往复，直至(a)的情形或叶子结点。我们称这个自堆顶至叶子的调整过程为“筛选”。如果有完全二叉树的图结合着看的话，效果会比较好。

然后问题1，从一个无序序列建堆的过程就是一个反复“筛选”的过程。若将些序列看成是一个完全二叉树，则最后一个非终端结点是第n/2（下取整）个元素，由些“筛选”只需从第n/2（下取整）个元素开始，一直到要第一个元素，即树根，堆顶。

下面是筛选的代码，即调整堆的过程：（注意在由于数组下标从0开始的，所以计算下标的时候要注意一下）

        static void HeapAdjust(int[] numbers, int index, int length)

        {

            for (int childIndex =  * index + ; childIndex <= length; childIndex *= )

            {

                if (childIndex < length && numbers[childIndex] < numbers[childIndex + ])

                {

                    // childIndex为两棵子树的根结点中较大的那个的下标

                    childIndex++;

                }

                if (numbers[index] >= numbers[childIndex])

                {

                    // 如果堆顶已经为三者（目前堆顶元素，堆顶元素左子树的根结点，堆顶元素右子树的根结点)最大值，

                    // 则堆已调整好，可以结束了。

                    break;

                }

                // 如果堆顶不是三者（目前堆顶元素，堆顶元素左子树的根结点，堆顶元素右子树的根结点)最大值

                // 则要进行交换

                Switch<int>(ref numbers[index], ref numbers[childIndex]);

            }

        }

        static void Switch<T>(ref T a, ref T b)

        {

            T temp;

            temp = a;

            a = b;

            b = temp;

        }

上面的方法中有一个可以优化的地方，即直到最后调整成为一个新堆的时候，才能确定原先的堆顶元素所在新的位置。比如，堆顶元素r和其一个孩子结点交换后，孩子结点所在的子树要进行新的调整，此时孩子结点所在的子树的根结点是r，r 又跟其一个孩子结点交换之后，新的堆构成了。那么，r的第一次交换其实就是可以优化的，只要事先保存了r的值，就不用交换了，只需为堆顶元素赋值即可，而不用把r的值再赋给其本来要交换的那个结点了。这个自己理解吧，和快速排序中的交换优化一模一样。所以代码可以优化为：

        static void HeapAdjust(int[] numbers, int index, int length)

        {

            int temp = numbers[index];

            for (int childIndex =  * index + ; childIndex <= length; childIndex *= )

            {

                if (childIndex < length && numbers[childIndex] < numbers[childIndex + ])

                {

                    childIndex++;

                }

                if (temp >= numbers[childIndex])

                {

                    break;

                }

                numbers[index] = numbers[childIndex];

                index = childIndex;

            }

            numbers[index] = temp;

        }

调整的代码完成之后，下面是堆排序的代码，这里我没有把由无序序列构建堆的过程封装到另一个方法里面，而是直接写了，你如果想另写一个方法的话，当然可以了。

        static void HeapSort(int[] numbers)

        {

            // 得到大顶堆

            for (int i = numbers.Length /  - ; i >= ; i--)

            {

                HeapAdjust(numbers, i, numbers.Length - );

            }

            // 开始堆排序

            // 1. 即将堆顶元素（最大值）跟最后一个元素交换，此时最大元素已经就绪，放到了最后

            // 2. 现在只需要关注前n-1个结点就可了，由于上一步将取后一个元素放到了根结点，所以前n-1个结点不再是大顶堆了，

            //    所以现在要调整堆为一个大顶堆，即筛选

            // 3. 一次筛选完成之后把堆顶元素再和最后一个交换，次大数就绪

            // 4. 循环这个过程，最终得到有序序列

            int temp;

            for (int i = numbers.Length - ; i > ; )

            {

                temp = numbers[i];

                numbers[i] = numbers[];

                numbers[] = temp;

                i--;

                HeapAdjust(numbers, , i);

            }

        }

下面是一个调用堆排序并输出排序结果的例子：

        static void Main(string[] args)

        {

            int[] numbers = { , , , , , , ,  };

            HeapSort(numbers);

            foreach (int i in numbers)

            {

                Console.Write(i.ToString() + " ");

            }


            Console.Read();

        }

最后，堆排序是一种不稳定的排序算法。时间复杂度为O(n*logn)，只需一个记录大小的辅助空间，即空间复杂度为O(1)。堆排序方法对记录数较少的文件并不值得提倡，但对于n比较大的文件还是很有效的。

小小c#算法题 - 7 - 堆排序 (Heap Sort)的更多相关文章

小小c#算法题 - 9 - 基数排序 (Radix Sort)
基数排序和前几篇博客中写到的排序方法完全不同.前面几种排序方法主要是通过关键字间的比较和移动记录这两种操作来实现排序的,而实现基数排序不需要进行记录项间的比较.而是把关键字按一定规则分布在不同的区域, ...
小小c#算法题 - 8 - 归并排序 (Merging Sort)
“归并”的含义是将两个或两个以上的有序序列组合成一个新的有序序列.这个“归并”可以在O(n+m)的数量级上实现,但这同时也需要O(n+m)的空间复杂度.具体为:首先分配一个新的长度为n+m的空序列,然 ...
Python入门篇-数据结构堆排序Heap Sort
Python入门篇-数据结构堆排序Heap Sort 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.堆Heap 堆是一个完全二叉树每个非叶子结点都要大于或者等于其左右孩子结点 ...
数据结构 - 堆排序(heap sort) 具体解释及代码(C++)
堆排序(heap sort) 具体解释及代码(C++) 本文地址: http://blog.csdn.net/caroline_wendy 堆排序包括两个步骤: 第一步: 是建立大顶堆(从大到小排 ...
小小c#算法题 - 11 - 二叉树的构造及先序遍历、中序遍历、后序遍历
在上一篇文章小小c#算法题 - 10 - 求树的深度中,用到了树的数据结构,树型结构是一类重要的非线性数据结构,树是以分支关系定义的层次结构,是n(n>=0)个结点的有限集.但在那篇文章中,只 ...
堆排序 Heap Sort
堆排序虽然叫heap sort,但是和内存上的那个heap并没有实际关系.算法上,堆排序一般使用数组的形式来实现,即binary heap. 我们可以将堆排序所使用的堆int[] heap视为一个完全 ...
算法----堆排序(heap sort)
堆排序是利用堆进行排序的高效算法,其能实现O(NlogN)的排序时间复杂度,详细算法分析能够点击堆排序算法时间复杂度分析. 算法实现: 调整堆: void sort::sink(int* a, con ...
数据结构与算法---堆排序(Heap sort)
堆排序基本介绍 1.堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序. 2.堆是具有以下性质的完全二叉树:每个 ...
小小c#算法题 - 6 - 快速排序 (QuickSort)
快速排序是排序算法中效率比较高的一种,也是面试常被问到的问题. 快速排序(Quick Sort)是对冒泡排序的一种改进.它的基本思想是,通过一趟排序将待排记录分割成独立的两部分,其中一部分记录的关键字 ...

随机推荐

《Javascript高级程序设计》阅读记录（七）：第七章
<Javascript高级程序设计>中,2-7章中已经涵盖了大部分精华内容,所以摘录到博客中,方便随时回忆.本系列基本完成,之后的章节,可能看情况进行摘录. 这个系列以往文字地址: < ...
Til the Cows Come Home （最短路模板题）
个人心得:模板题,不过还是找到了很多问题,真的是头痛,为什么用dijkstra算法book[1]=1就错了..... 纠结中.... Bessie is out in the field and wa ...
Photon多人游戏开发教程
http://gad.qq.com/article/detail/26112 PUN介绍入门 Photon Unity Networking(首字母缩写PUN)是一个Unity多人游戏插件包.它提供 ...
untra edit 显示文件函数列表
UltraEdit的函数列表竟然不显示函数,那这功能要它何用,应该如何才能让函数显示出来呢? 1:先查看一下UE的菜单:视图-->查看方式(语法高亮类型)-->选择相应的语言(我们用的是C ...
Visualforce Page超链接
Salesforce开发者文档:https://developer.salesforce.com/docs/atlas.en-us.pages.meta/pages/pages_quick_start ...
java代码包装类----------Integer
总结:我的笔试挂了..基础的继承不懂不会.我不知道到底是哪里的问题. 要好好反思 package com.da.ima2; public class jrfk { // int整型不能直接转化为Int ...
断路器之一：Hystrix 使用与分析
一:为什么需要Hystrix? 在大中型分布式系统中,通常系统很多依赖(HTTP,hession,Netty,Dubbo等),如下图: 在高并发访问下,这些依赖的稳定性与否对系统的影响非常大,但是依赖 ...
AngularJS：应用
ylbtech-AngularJS:应用 1.返回顶部 1. AngularJS 应用现在是时候创建一个真正的 AngularJS 单页 Web 应用(single page web applica ...
mysql查询最近30天、7天、每天、昨天、上个月的记录
一些变量说明: add_time为插入的时间 to_days是sql函数,返回的是个天数 data_sub(date,INTERVAL expr type)给指定的日期减去多少天 data()函数 ...
Apache Continuum 远程命令执行漏洞
这个是apache现在不维护的服务了. 服务使用了struts2框架,目前测试是使用的最新版.

小小c#算法题 - 7 - 堆排序 (Heap Sort)

小小c#算法题 - 7 - 堆排序 (Heap Sort)的更多相关文章

随机推荐

热门专题