在讲解合并排序之前,我们先来想一想下面这个问题如何解决:

  有两个数组A和B,它们都已各自按照从小到大的顺序排好了数据,现在我们要把它们合并为一个数组C,且要求C也是按从小到大的顺序排好,请问该怎么做?

  这个问题非常容易解决,我们将A、B和C都视为队列,然后不断比较A和B的首部,取出其中更小的数据出队,然后将该数据插入队列C,若A或B有一方为空了,则将另一方数据顺序出队再插入C即可:

int i=,j=,z=;
while(i<a_size && j<b_size)
{
if(a[i]<b[j])
c[z++]=a[i++];
else
c[z++]=b[j++];
}
while(i<a_size)
c[z++]=a[i++];
while(j<b_size)
c[z++]=b[j++];

  显然,上述问题的解决非常简单,时间复杂度为O(N),N为总数据量。也就是说,如果我们有两个已排好序的数组,那么我们就可以快速地将它们合并起来,而这,就是合并排序的根本思想。

  回顾快速排序,可以看出快速排序的做法其实就是:选取枢纽,将小于枢纽的元素组成一个子数组,大于枢纽的元素组成一个子数组,只要这两个子数组排好序,整个数组就能排好序,至于两个子数组怎么排好序,递归实现。

  合并排序的做法与快速排序有些类似,只是“过程”反了过来:将原数组对半分为两个子数组,只要这两个子数组排好序,我就能将它们通过合并(上述问题的解法)来得到有序的原数组,至于怎么得到两个排好序的子数组,递归实现。

  用伪代码来表示合并排序的过程,就是这样:

void MergeSort(int *src,unsigned int left,unsigned int right)
{
if(left<right)
{
/*将原数组一分为二*/
unsigned int center= (left+right)/;
/*通过递归实现子数组的排序*/
MergeSort(src,,center);
MergeSort(src,center+,right);
/*伪代码:将子数组合并*/
}
}

  有了伪代码后,剩下的工作就是将伪代码中的“空”填上去。

  上述伪代码有两个“空”,一个是实现递归的基准情形,这个“空”很好填,因为根本不用填,为什么呢?因为只要数组大小大于1,我们就一直划分下去,那么最终划分得到的子数组将会只有1个数据,此时这个子数组必为“有序”,也就是说递归的基准情形必然存在。

  另一个“空”则是实现子数组的合并,这个“空”我们可以参考本文一开始提出的问题的解法,但是该解法需要用到一个额外的数组C,且最终的有序数据都放进了C里面,该怎么办呢?思路很简单也很直接,那就是:既然你要一个额外数组,那我就给你一个额外数组tempArr,有序数据在tempArr里面,而我希望它们在原数组里面,那我就将tempArr里的数据复制回来:

        /*将子数组合并到tempArr*/

        unsigned int i=left,j=center+,z=left; //注意,i,j,z的初始化和范围都要有所变化
while(i<=center&&j<=right)
{
if(src[i]<src[j])
tempArr[z++]=src[i++];
else
tempArr[z++]=src[j++];
}
while(i<=center)
tempArr[z++]=src[i++];
while(j<=right)
tempArr[z++]=src[j++]; /*将tempArr的数据拷贝到原数组中*/
for (z = left;z <= right;++z)
src[z] = tempArr[z];

  将上面的代码填入到伪代码中,并将伪代码的参数稍加修改,便有了如下合并排序:

void MSort(int *src, int *tempArr, unsigned int left, unsigned int right)
{
if (left < right)
{
/*将原数组一分为二*/
unsigned int center = (left + right) / ; /*递归实现子数组排序*/
MSort(src, tempArr, left, center);
MSort(src, tempArr, center + , right); /*将子数组合并到tempArr*/
unsigned int i=left,j=center+,z=left;
while(i<=center&&j<=right)
{
if(src[i]<src[j])
tempArr[z++]=src[i++];
else
tempArr[z++]=src[j++];
}
while(i<=center)
tempArr[z++]=src[i++];
while(j<=right)
tempArr[z++]=src[j++]; /*将tempArr的数据拷贝到原数组中*/
for (int i = left;i <= right;++i)
src[i] = tempArr[i];
}
}

  为了方便调用,我们再实现一个小接口:

void MergeSort(int *src, unsigned int size)
{
int *tempArr = (int *)malloc(sizeof(int)*size);
MSort(src, tempArr, , size - );
free(tempArr);
}

  

  至此,合并排序就实现完毕了,其占用的空间显然比快速排序等算法要多出一倍,那么其时间复杂度如何呢?我们就来简单的算算看。

  首先,我们假设进行合并排序的数组大小为N且为2的幂,T(N)表示对其排序耗费的时间,那么就有:

  1.T(1)=1

  2.T(N)=2*T(N/2)+2N(两个N分别为合并耗费时间和拷贝回原数组所耗费的时间)

  将2式左右除以N,得:

  T(N)/N=T(N/2)/(N/2)+2

  递推该式,得:

  T(N/2)/(N/2)=T(N/4)/(N/4)+2

  T(N/4)/(N/4)=T(N/8)/(N/8)+2

  ……
  T(2)/2=T(1)/1+2

  将上述所有式子左侧相加且右侧相加,得:

  T(N)/N+T(N/2)/(N/2)+T(N/4)/(N/4)+……+T(2)/2=T(N/2)/(N/2)+T(N/4)/(N/4)+……+T(1)/1+2*logN

  化简,得:

  T(N)/N=T(1)/1+2*logN,即T(N)=N+2*N*logN=O(N*logN)

  这个时间复杂度与快速排序的平均时间复杂度相同,比快速排序的最坏情况要好得多,但是在实际应用中快速排序要比合并排序优先考虑,原因在于合并排序需要更多的内存空间,并且从tempArr拷贝数据回原数组也是一项花费巨大的工作。

深入浅出数据结构C语言版(21)——合并排序的更多相关文章

  1. 深入浅出数据结构C语言版(22)——排序决策树与桶式排序

    在(17)中我们对排序算法进行了简单的分析,并得出了两个结论: 1.只进行相邻元素交换的排序算法时间复杂度为O(N2) 2.要想时间复杂度低于O(N2),算法必须进行远距离的元素交换 而今天,我们将对 ...

  2. 深入浅出数据结构C语言版(17)——有关排序算法的分析

    这一篇博文我们将讨论一些与排序算法有关的定理,这些定理将解释插入排序博文中提出的疑问(为什么冒泡排序与插入排序总是执行同样数量的交换操作,而选择排序不一定),同时为讲述高级排序算法做铺垫(高级排序为什 ...

  3. 深入浅出数据结构C语言版(17)——希尔排序

    在上一篇博文中我们提到:要令排序算法的时间复杂度低于O(n2),必须令算法执行"远距离的元素交换",使得平均每次交换减少不止1逆序数. 而希尔排序就是"简单地" ...

  4. 深入浅出数据结构C语言版(16)——插入排序

    从这一篇博文开始,我们将开始讨论排序算法.所谓排序算法,就是将给定数据根据关键字进行排序,最终实现数据依照关键字从小到大或从大到小的顺序存储.而这篇博文,就是要介绍一种简单的排序算法--插入排序(In ...

  5. 深入浅出数据结构C语言版(5)——链表的操作

    上一次我们从什么是表一直讲到了链表该怎么实现的想法上:http://www.cnblogs.com/mm93/p/6574912.html 而这一次我们就要实现所说的承诺,即实现链表应有的操作(至于游 ...

  6. 深入浅出数据结构C语言版(1)——什么是数据结构及算法

    在很多数据结构相关的书籍,尤其是中文书籍中,常常把数据结构与算法"混合"起来讲,导致很多人初学时对于"数据结构"这个词的意思把握不准,从而降低了学习兴趣和学习信 ...

  7. 深入浅出数据结构C语言版(8)——后缀表达式、栈与四则运算计算器

    在深入浅出数据结构(7)的末尾,我们提到了栈可以用于实现计算器,并且我们给出了存储表达式的数据结构(结构体及该结构体组成的数组),如下: //SIZE用于多个场合,如栈的大小.表达式数组的大小 #de ...

  8. 深入浅出数据结构C语言版(12)——从二分查找到二叉树

    在很多有关数据结构和算法的书籍或文章中,作者往往是介绍完了什么是树后就直入主题的谈什么是二叉树balabala的.但我今天决定不按这个套路来.我个人觉得,一个东西或者说一种技术存在总该有一定的道理,不 ...

  9. 深入浅出数据结构C语言版(15)——优先队列(堆)

    在普通队列中,元素出队的顺序是由元素入队时间决定的,也就是谁先入队,谁先出队.但是有时候我们希望有这样的一个队列:谁先入队不重要,重要的是谁的"优先级高",优先级越高越先出队.这样 ...

随机推荐

  1. 基于ExtJs6前台,SpringMVC-Spring-Mybatis,resteasy,mysql无限极表设计,实现树状展示数据(treepanel)

    先从后台讲起 1.表的设计 parent_id就是另外一条记录的id,无限极表设计可以参考  http://m.blog.csdn.net/Rookie_Or_Veteran/article/deta ...

  2. (转)新手写爬虫v2.5(使用代理的异步爬虫)

    开始 开篇:爬代理ip v2.0(未完待续),实现了获取代理ips,并把这些代理持久化(存在本地).同时使用的是tornado的HTTPClient的库爬取内容. 中篇:开篇主要是获取代理ip:中篇打 ...

  3. WebDriver中自动识别验证码--Python实现

    一.在自动化测试中,遇到验证码的处理方法有以下两种: 1.找开发去掉验证码或者使用万能验证码 2.使用OCR自动识别 这里,方法一只要和研发沟通就行. 使用pytesseract自动化识别,一般识别率 ...

  4. struts2--Action

    HTTP请求 提交 Struts2 StrutsPrepareAndExecuteFilter 核心控制器 -- 请求分发给不同Action Action书写的的三种格式 第一种 Action可以是 ...

  5. 报表 jasper + ireport5.6

    下载 iReport-5.6.0,jdk7,以及众多lib , 这里我提供下资源(我的百度云) 安装好iReport-5.6.0和jdk7,  在安装目录的\etc\ireport.conf,修改其中 ...

  6. Appium环境搭建(python)

    appium是一个开源的,适用于原生或者移动网络和混合应用程序在 iOS 和 Android 平台上的的开源自动化测试框架.在这里,详细的介绍Appium的环境搭建步骤. 1.安装Node.js在ht ...

  7. Linux-insmod/rmmod/lsmod驱动模块相关命令(10)

    insmod:加载模块 参数: -f 不检查目前kernel版本与模块编译时的kernel版本是否一致,强制将模块载入.-k 将模块设置为自动卸除.-m 输出模块的载入信息.-o   <模块名称 ...

  8. asp.net mvc 4 项目升级到 asp.net mvc5

    一.开始 1.打开或新建asp.net mvc 4项目 2.修改 global.asax文件 原: WebApiConfig.Register(GlobalConfiguration.Configur ...

  9. Project 2:传奇汉诺塔

    汉诺塔简介:汉诺塔问题是源于印度一个古老传说的益智玩具.大梵天创造世界的时候做了三根金刚石柱子,在一根柱子上从下往上按照大小顺序摞着64片黄金圆盘.大梵天命令婆罗门把圆盘从下面开始按大小顺序重新摆放在 ...

  10. 团队作业8----第二次项目冲刺(beta阶段)5.24

    Day6-05.24 1.每日会议 会议内容: 1.组长林乔桦对昨日的工作进行了总结并且安排今日的任务. 2.阶段进入尾声,大家再一次集中对软件进行了优化讨论. 3.今天主要大家的工作重心放在异常的测 ...