MIT算法导论——第一讲.Analysis of algorithm

本栏目（Algorithms）下MIT算法导论专题是个人对网易公开课MIT算法导论的学习心得与笔记。所有内容均来自MIT公开课Introduction to Algorithms中Charles E. Leiserson和Erik Demaine老师的讲解。（http://v.163.com/special/opencourse/algorithms.html）

第一节-------课程简介及算法分析 Analysis of algorithm

算法分析：关于计算机程序在效率和资源利用方面的理论研究。

第一节课的内容相对来说比较简单，但是大牛就是大牛，能够把抽象的东西说的相当形象，让人过目不忘的同时去思考背后的原理。总结一下，主要有以下几个知识点。

1.算法分析的主要内容是效率，有比效率更重要的吗？当然有，比如正确性、可维护性、可扩展性、健壮性、安全性等等，可以想象得到以前很多在软件工程中谈论到的重要的东西。既然如此，为什么还要进行算法的效率分析呢？在课上老师说了一个很有意思的比方，你认为钱重要还是水和饭重要？当然是水和饭，钱是不能保证人的生存的，但是钱却可以换来水和饭。而算法分析中的“效率”就相当于“钱”，你可以用“效率”来换取其他东西，比如安全性，稳定性等等。它只是一个交换物，但我们，却离不开它。

2.衡量效率的因素。既然效率如此重要，我们用什么因素来衡量一个程序效率的高低呢？运行时间。对于同一组输入，你的程序运行时间比别人的短，就说明你的程序在这组数据集上的效率比别人的高。

对于运行时间，需要考虑的因素有如下三个：

a、数据的输入情况。例如，对于插入排序算法来说，一个已经排好序的序列更容易排序；

b、数据的规模。很显然，短的序列要比长序列更容易排序；

c、找到运行时间上界。一般情况下，我们需要找到这个程序对于最坏的输入数据的情况下，运行时间是多长。毕竟，每个人都想得到一个guarantee。

3.几种分析运行时间的方法T(n)。

Worst-case:(usually) —— 用T(n)来表示算法在输入规模为n时的最大运行时间。它的作用就是你可以用它来给别人做出承诺，即我的算法在最坏的情况下的运行时间也不会超过T(n)。

Average-case:(sometimes)—— 用T(n)来表示算法在所有输入规模为n的序列的运行时间的一个期望值。当然它的前提是假设输入的统计概率分布，也就是说对于一个规模为n的输入数据，它所有的排列方式出现的概率是相等的。

Best-case:(bogus)——而如果你想骗人，用一组极好的数据在一个效率极低的算法上跑，我们称之为算法的运行时间的最好情况，这是不够说服人的。

4.Big Idea——渐近分析。

我们通常所说的运行时间，都会存在一个相对时间与绝对时间的区别。比如在一台巨型机和在一台微机上运行同一个程序，所用的时间显示是不同的。这是我们就需要引入一个更加宏观的概念：渐近分析——对于一个算法的运行时间，忽略那些依赖于机器的常量；忽略所有的低阶项，只分析最高阶项；关注于运行时间的增长，而不仅仅只是运行时间。引入一个助记符号θ(n)，举一个例子：如果一个算法的运行时间为：3n^3 + 2n^2 + 4n + 1，那么忽略掉依赖机器的常量1，以及所有的低阶项2n^2、4n，那么这个算法的时间复杂度就为θ(n^3)。

在这里，老师也进行了很形象的说明。如果算法A的渐近时间复杂度是θ(n^3)，算法B的是θ(n^2)，那么一定存在一个足够大的n，使得当数据规模大于n时，算法B的运行时间要小于A，不管算法A一开始的优势有多么大，不管算法B的渐近复杂度的系数和常数有多么大，都没有用。用这样一个助记符就可以将时间复杂度的分析独立于机器，独立于具体的常数，对我们分析算法将会十分有利。

5.两个例子——插入排序、归并排序

插入排序的思想就是，对于每一个A[i]，考虑A[1...i-1]中它的合适的插入位置k，然后将A[k...i-1]依次后移一个位置，把A[i]插入到A[k]的位置即可。

上面就是插入排序的伪代码，用缩进代表算法的层次。对插入排序做渐近分析，如下图所示。下面一系列分析过程说明了插入排序的渐近时间复杂度是n^2级别的。

所谓归并排序，举个例子，归并排序递归处理的两个表已经有序了，为{2, 7, 13, 20}和{1, 9, 11, 12}。

我们如何合并这两个表呢？这两个表已经是有序的了，我们要找出当前表中剩下的最小元素，这个最小元素一定是在表1的头部或表2的头部，然后取出来，放入总的表中，此时我们取出了1这个元素。那么表2中还剩下3个元素，然后再接着比较表1和表2，找出最小的元素，为2，这样我们依次找下去，便可以将两个有序表合并成一个有序表。如下图所示。

下图是归并排序的伪代码以及算法渐近分析。

下面我们用递归树的方法来分析这个算法的运行时间，首先写出运行时间的递归表达式：如果我们考虑n>1的情况，T(n) = 2T(n/2) + Cn，其中C为一个常数。画成递归树的形式如下图所示：

那么，我们看一下上面第三幅图，第一行的时间和为Cn，第二行的时间和为C(n/2)+C(n/2) = Cn，...，第lgn行的时间的和为θ(n)。其中，lgn为树的高度，简单分析即可得出。

那么一共lgn行，每行时间和为Cn，简单计算即可知这棵递归树的总的时间和(即算法的渐近时间和)为 (Cn)lgn + θ(n)，忽略低阶项θ(n)，即算法的渐近时间复杂度为θ(nlgn)。

讲到这里，第一节的内容也就快结束了。老师最后给出了一个结论：归并排序能够在效率上当输入规模n增大的时候渐近的超过插入排序，在最坏的情况下。实际上，当n>30以及以上的时候，归并排序的效率就比插入排序的效率要高了。Go test it out for yourself!

关于Introduction to Algorithms更多的学习资料将继续更新，敬请关注本博客和新浪微博Sheridan。

MIT算法导论——第一讲.Analysis of algorithm的更多相关文章

MIT算法导论——第二讲.Solving Recurrence
本栏目(Algorithms)下MIT算法导论专题是个人对网易公开课MIT算法导论的学习心得与笔记.所有内容均来自MIT公开课Introduction to Algorithms中Charles E. ...
MIT算法导论——第四讲.Quicksort
本栏目(Algorithms)下MIT算法导论专题是个人对网易公开课MIT算法导论的学习心得与笔记.所有内容均来自MIT公开课Introduction to Algorithms中Charles E. ...
MIT算法导论——第五讲.Linear Time Sort
本栏目(Algorithms)下MIT算法导论专题是个人对网易公开课MIT算法导论的学习心得与笔记.所有内容均来自MIT公开课Introduction to Algorithms中Charles E. ...
MIT算法导论——第三讲.The Divide-and-Conquer
本栏目(Algorithms)下MIT算法导论专题是个人对网易公开课MIT算法导论的学习心得与笔记.所有内容均来自MIT公开课Introduction to Algorithms中Charles E. ...
MIT算法导论笔记
详细MIT算法导论笔记 (网络链接) 第一讲:课程简介及算法分析 (Sheridan) 第二讲:渐近符号.递归及解法 (Sheridan) 第三讲:分治法(1)(Sheridan) 第四讲:快排及随 ...
算法导论第一章and第二章(python)
算法导论第一章算法输入--(算法)-->输出解决的问题识别DNA(排序,最长公共子序列,) # 确定一部分用法互联网快速访问索引电子商务(数值算 ...
MIT算法导论课程
http://open.163.com/movie/2010/12/G/F/M6UTT5U0I_M6V2T1JGF.html
干货|漫画算法：LRU从实现到应用层层剖析（第一讲）
今天为大家分享很出名的LRU算法,第一讲共包括4节. LRU概述 LRU使用 LRU实现 Redis近LRU概述第一部分:LRU概述 LRU是Least Recently Used的缩写,译为最近最 ...
[Algorithm] 如何正确撸<算法导论>CLRS
其实算法本身不难,第一遍可以只看伪代码和算法思路.如果想进一步理解的话,第三章那些标记法是非常重要的,就算要花费大量时间才能理解,也不要马马虎虎略过.因为以后的每一章,讲完算法就是这样的分析,精通的话 ...

随机推荐

Android 多国语言
参考android 开发文档, ISO 639-1 ISO 3166-1-alpha-2 关于中国的: 中国其他地区: https://en.wikipedia.org/wiki/ISO_3166 ...
nodejs ssh2
https://www.npmjs.com/package/ssh2 npm install ssh2 ssh2文件下载: //前台命令下发 app.get('/test/fileDownload' ...
How to begin Python learning?
如何开始Python语言学习? 1. 先了解它,Wiki百科:http://zh.wikipedia.org/zh-cn/Python 2. Python, Ruby等语言来自开源社区,社区的学法是V ...
基于Python的密码生成程序的优化
近期刚刚组织完内部的Python基础培训.GUI的开发培训,之后布置的作业是两人一组,利用前面所写的一些模块做一些小软件. 具体就是模拟Advanced Password Generator这个软件的 ...
VS2010打开VS2012解决方法
VS2012中对C#的支持度非常好,不管是编写方便程度(不需要插件就能高亮代码及代码自动提示功能),还对MFC的一些功能优化很多. 我们可以修改两个工程文件来把VS2012的工程文件一直到VS2010 ...
Activity的Launch mode详解 singleTask正解
Activity有四种加载模式:standard(默认), singleTop, singleTask和 singleInstance.以下逐一举例说明他们的区别: standard:Activity ...
简单的C#线程开发实例(隔一秒改变一下Label的Text)
要实现的效果:点击按纽,窗口上的label上出现1~100数字的变化. 第一个实例(把窗口上的label上文字改成0): using System; using System.Windows.Form ...
指向const的指针和const指针
1.指向const的指针:const int *p 或 int const *p 解释:p是一个指针,指向const int类型的常量:指针指向的内容为常量,因此不能改变*p的值,但指针p可以改变,指 ...
Ado.Net实现简易（省、市、县）三级联动查询，还附加Access数据
小弟在博客园驻园不久,初来咋到:将最近写的小程序附上,希望各位大牛们吐槽:激发对程序员围观的童鞋们,赶紧加入IT行业,如果你在上海那简称就是SHIT,哈哈题外话,以下开始切入正题: 坐公交车是旁边偶遇 ...
uoj 67 新年的毒瘤割点
题目链接: 题目 #67. 新年的毒瘤问题描述辞旧迎新之际,喜羊羊正在打理羊村的绿化带,然后他发现了一棵长着毒瘤的树. 这个长着毒瘤的树可以用 nn 个结点 mm 条无向边的无向图表示.这个图中有 ...

MIT算法导论——第一讲.Analysis of algorithm

MIT算法导论——第一讲.Analysis of algorithm的更多相关文章

随机推荐

热门专题