《算法导论》 — Chapter 8 线性时间排序
序
到目前为止,关于排序的问题,前面已经介绍了很多,从插入排序、合并排序、堆排序以及快速排序,每一种都有其适用的情况,在时间和空间复杂度上各有优势。它们都有一个相同的特点,以上所有排序的结果序列,各个元素的次序都是基于输入元素之间的比较,因此,把这类排序成为比较排序。
对一个含有n个元素的输入序列,任何比较排序在最坏情况下都要用(nlogn)次比较来进行排序,由此也可以知道合并排序和堆排序是渐进最优的。
本章介绍了三种线性时间排序算法,计数排序、基数排序和桶排序,这些算法都是用非比较的操作来确定排序顺序。
下面将详细介绍这三种排序算法的实现。
计数排序
计数排序是基于对输入数据作某种假设条件下进行的排序算法。其作出,输入是由一个小范围内整数构成,即n个输入元素中的每一个都是介于0~k之间的整数。当k = O(n)时,计数排序的运行时间为O(n)。
其基本思想是,对每一个输入元素x,确定出小于x的元素个数,即要得出这个元素x是第几个位置,有了这样的信息,就可以把x直接放在最终的输出数组当中。
下面给出计数排序的算法实现,输入数据为data[] , 输出结果存在result[]中,输入数据个数为N = 10 , 每个元素都是位于 0~101 之间的整数,MAX = 101;
#include <iostream>
#include <ctime>
#include <cstdlib>
#define N 10
#define MAX 101
using namespace std;
//计数排序函数声明
void CountingSort(int *data, int *result, int k);
int main()
{
//声明一个待排序数组
int array[N];
//声明排序后数组
int result[N];
//设置随机化种子,避免每次产生相同的随机数
srand(time(0));
for (int i = 0; i<N; i++)
{
array[i] = rand() % MAX;//数组赋值使用随机函数产生1-100之间的随机数
}
cout << "排序前:" << endl;
for (int j = 0; j<N; j++)
{
cout << array[j] << " ";
}
cout << endl << "排序后:" << endl;
//调用快速排序函数对该数组进行排序
CountingSort(array, result , MAX);
for (int k = 0; k<N; k++)
{
cout << result[k] << " ";
}
cout << endl;
system("pause");
return 0;
}//main
//计数排序算法实现
void CountingSort(int *data, int *result, int k)
{
int C[MAX] = { 0 };
//(1) 费时 O(k)
for (int i = 0; i < k; i++)
C[i] = 0;
//(2) 费时O(n)
for (int j = 0; j < N; j++)
C[data[j]] = C[data[j]] + 1;
//(3) 费时O(k)
for (int i = 1; i < k; i++)
{
C[i] = C[i] + C[i - 1];
}
//测试当前源数据的目标位置
/*for (int k = 0; k < N; k++)
{
cout << C[data[k]] << "\t";
}*/
//得到排序后的目标序列
//(4)费时 O(n)
for (int j = 0; j < N ; j++ )
{
//保证数据下标不会越界 需-1
result[C[data[j]]-1] = data[j];
C[data[j]] -= 1;
}
}
计数排序是一种稳定的排序算法,所谓稳定性,即是指具有相同值的元素在输出数组中的相对次序与它们在输入数组中的次序相同。
对于计数排序的性能,它由于前面介绍的比较排序时间下界(nlogn),从以上代码可以看出,计数排序算法步骤(1)~(4)所需的时间复杂度为O(n+k) , 当k=O(n)时,运行时间则为O(n)是一个线性时间排序算法。
基数排序
基数排序是一种按位排序算法,对输入待排序序列,求出其最大位数,从低有效位到最高有效位,分别对改组数据进行排序。
代码实现如下:
#include <iostream>
#include <ctime>
#include <cstdlib>
#define N 10
#define MAX 1000
using namespace std;
//基数排序函数声明
void RadixSort(int *data, int n);
//计算待排数组中最长位数
int ComputeDigits(int *data , int n);
//按照d位数字对数组排序算法
void digitSort(int *data, int n, int d);
int main()
{
//声明一个待排序数组
int array[N];
//设置随机化种子,避免每次产生相同的随机数
srand(time(0));
for (int i = 0; i<N; i++)
{
array[i] = rand() % MAX;//数组赋值使用随机函数产生1-100之间的随机数
}
cout << "排序前:" << endl;
for (int j = 0; j<N; j++)
{
cout << array[j] << " ";
}
cout << endl << "排序后:" << endl;
//调用快速排序函数对该数组进行排序
RadixSort(array, N);
for (int k = 0; k<N; k++)
{
cout << array[k] << " ";
}
cout << endl;
system("pause");
return 0;
}//main
//基数排序算法实现
void RadixSort(int *data, int n)
{
int digits = ComputeDigits(data, n);
//选用一个稳定排序以各位数字对输入序列排序
for (int i = 0; i < digits; i++)
{
digitSort(data, n, i);
}
}
//计算待排数组中最长位数
int ComputeDigits(int *data , int n)
{
int max = data[0];
for (int i = 1; i < n; i++)
{
if (data[i] > max)
max = data[i];
}
//临时计数变量
int count = 0;
while (max)
{
count++;
max /= 10;
}
return count;
}
//按照d位数字对数组排序算法
void digitSort(int *data, int n, int d)
{
int digitArray[10][N];
for (int i = 0; i < 10; i++)
for (int j = 0; j < N; j++)
digitArray[i][j] = -1;
//当前输入序列中有n个数字待排
for (int i = 0; i < n; i++)
{
//得到当前位对应的数字
int index = data[i] / (int)pow(10, d) % 10;
for (int j = 0; j < n; j++)
{
if (digitArray[index][j] == -1)
{
digitArray[index][j] = data[i];
break;
}
}
}
int k = 0;
//将按位排序后的数组更新到源序列
for (int i = 0; i < 10; i++)
{
for (int j = 0; j < N; j++)
{
if (digitArray[i][j] != -1)
{
data[k++] = digitArray[i][j];
digitArray[i][j] = -1;
}
}
}
}
基数排序是一种稳定排序,以上代码中,对各位分别排序采用的是接下来介绍的桶排序。
桶排序
对于桶排序与计数排序类似也是对输入做了某种假设,因而运行很快。假设输入待排序列是由一个随机过程产生,该过程将元素均匀而独立的分布在[0 , 1) 上,桶排序的思想就是将该区间均匀的分成n个大小相同的桶,分别对各个桶中的元素按照直接插入排序,然后再把各个桶列出来即是排序结果。
对于桶排序的程序实现,输入采用[0 , 1000)的一组数据,道理同上,按照元素的最高位,建立下标为0~9的十个桶,将相应元素加入到相应桶中,加入过程采用直接插入排序,然后将桶中元素按照下标递增的方式罗列,即是最终排序结果。
#include <iostream>
#include <ctime>
#include <cstdlib>
#define N 10
#define MAX 1000
using namespace std;
//桶排序函数声明
void BucketSort(int *data, int n);
//计算待排数组中最长位数
int ComputeDigits(int *data, int n);
int main()
{
//声明一个待排序数组
int array[N];
//设置随机化种子,避免每次产生相同的随机数
srand(time(0));
for (int i = 0; i<N; i++)
{
array[i] = (rand() % MAX);//数组赋值使用随机函数产生1-1000之间的随机数
}
cout << "排序前:" << endl;
for (int j = 0; j<N; j++)
{
cout << array[j] << " ";
}
cout << endl << "排序后:" << endl;
//调用快速排序函数对该数组进行排序
BucketSort(array , N);
for (int k = 0; k<N; k++)
{
cout << array[k] << " ";
}
cout << endl;
system("pause");
return 0;
}//main
//计算待排数组中最长位数
int ComputeDigits(int *data, int n)
{
int max = data[0];
for (int i = 1; i < n; i++)
{
if (data[i] > max)
max = data[i];
}
int count = 0;
while (max)
{
count++;
max /= 10;
}
return count;
}
void BucketSort(int *data, int n)
{
//计算输入序列中最大元素的位数
int digits = ComputeDigits(data, n);
//按照最高位0~9 创建10个桶
int bucket[10][N+1];
for (int i = 0; i < 10; i++)
{
//该桶的第一个元素设置为存储桶中元素个数
bucket[i][0] = 0;
//其余元素初始化为-1
for (int j = 1; j < N + 1; j++)
bucket[i][j] = -1;
}
//对每个输入元素按照插入排序放入相应的桶中
for (int i = 0; i < n; i++)
{
//得到目标桶的序号
int index = data[i] / (int)pow(10, digits-1);
//得到当前桶中元素个数
int count = bucket[index][0];
int j = count;
//按照直接插入排序将元素插入桶中
while (j >0 && bucket[index][j] > data[i])
{
bucket[index][j + 1] = bucket[index][j];
j--;
}
bucket[index][j + 1] = data[i];
bucket[index][0]++;
}
//将每个桶中的元素合并到data中
int k = 0;
for (int i = 0; i < 10; i++)
{
for (int j = 1; j <= bucket[i][0] ; j++)
{
data[k++] = bucket[i][j];
}
}
}
桶排序是一种线性时间排序算法,运行时间可以达到 O(n)
《算法导论》 — Chapter 8 线性时间排序的更多相关文章
- 算法导论 第八章 线性时间排序(python)
比较排序:各元素的次序依赖于它们之间的比较{插入排序O(n**2) 归并排序O(nlgn) 堆排序O(nlgn)快速排序O(n**2)平均O(nlgn)} 本章主要介绍几个线性时间排序:(运算排序非比 ...
- 算法导论学习之线性时间求第k小元素+堆思想求前k大元素
对于曾经,假设要我求第k小元素.或者是求前k大元素,我可能会将元素先排序,然后就直接求出来了,可是如今有了更好的思路. 一.线性时间内求第k小元素 这个算法又是一个基于分治思想的算法. 其详细的分治思 ...
- "《算法导论》之‘排序’":线性时间排序
本文参考自一博文与<算法导论>. <算法导论>之前介绍了合并排序.堆排序和快速排序的特点及运行时间.合并排序和堆排序在最坏情况下达到O(nlgn),而快速排序最坏情况下达到O( ...
- Python线性时间排序——桶排序、基数排序与计数排序
1. 桶排序 1.1 范围为1-M的桶排序 如果有一个数组A,包含N个整数,值从1到M,我们可以得到一种非常快速的排序,桶排序(bucket sort).留置一个数组S,里面含有M个桶,初始化为0.然 ...
- 《算法导论》读书笔记之排序算法—Merge Sort 归并排序算法
自从打ACM以来也算是用归并排序了好久,现在就写一篇博客来介绍一下这个算法吧 :) 图片来自维基百科,显示了完整的归并排序过程.例如数组{38, 27, 43, 3, 9, 82, 10}. 在算法导 ...
- 排序算法的C语言实现(下 线性时间排序:计数排序与基数排序)
计数排序 计数排序是一种高效的线性排序. 它通过计算一个集合中元素出现的次数来确定集合如何排序.不同于插入排序.快速排序等基于元素比较的排序,计数排序是不需要进行元素比较的,而且它的运行效率要比效率为 ...
- "《算法导论》之‘线性表’":基于静态分配的数组的顺序表
首先,我们来搞明白几个概念吧(参考自网站数据结构及百度百科). 线性表 线性表是最基本.最简单.也是最常用的一种数据结构.线性表中数据元素之间的关系是一对一的关系,即除了第一个和最后一个数据元素之外, ...
- "《算法导论》之‘线性表’":双向循环链表
本文双链表介绍部分参考自博文数组.单链表和双链表介绍 以及 双向链表的C/C++/Java实现. 1 双链表介绍 双向链表(双链表)是链表的一种.和单链表一样,双链表也是由节点组成,它的每个数据结点中 ...
- "《算法导论》之‘线性表’":基于数组实现的单链表
对于单链表,我们大多时候会用指针来实现(可参考基于指针实现的单链表).现在我们就来看看怎么用数组来实现单链表. 1. 定义单链表中结点的数据结构 typedef int ElementType; cl ...
随机推荐
- 2018 年度码云热门项目排行榜 TOP 10
2016 年度码云热门项目排行榜 TOP 10 是通过开源项目2016年在码云上的 Watch.Star.Fork 数量来评定的榜单.码云平台发展至今,涌现了越来越多优秀的开源项目,越来越多的开源作者 ...
- PMD - Avoid autogenerated methods to access private fields and methods of inner / outer classes
PMD错误 Avoid autogenerated methods to access private fields and methods of inner / outer classes 样例 p ...
- Rsync 实现远程同步
介绍 rsync命令是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件.rsync使用所谓的“rsync算法”来使本地和远程两个主机之间的文件达到同步,这个算法只传送两个文件的不同部 ...
- 洛谷1083(差分+二分 or 线段树)
第一种方法:可以二分最大天数订单的答案然后通过差分求一下是否可行. ; int n, m, a[maxn], ans; struct section { int cnt, l, r; }b[maxn] ...
- Vue-cli构建项目, 组件中js代码引入图片路径问题
问题描述 .vue的组件分成三个部分, template结构部分, script路径代码, style页面样式 首先, 我们可以在template可以正确引入, 无论是dev, 还是build都没有问 ...
- 用css来修饰页面文本
<html> <head> <title>修饰文本字体</title> <style type="text/css"> ...
- c库函数-字符串
一 strok:从字符串中按照分隔符提取所有字串 char s[] = "水发产品,47.6,不合格,mg/kg,17-05-21 15:04;"; char *delim = ...
- Oracle、MySQL和SqlServe分页查询的语句区别
★先来定义分页语句将要用到的几个参数: int currentPage ; //当前页 int pageRecord ; //每页显示记录数 以之前的ADDRESSBOOK数据表为例(每页显示10条记 ...
- hihocoder1067 最近公共祖先·二
思路: 使用tarjan算法,这是一种离线算法. 实现: #include <bits/stdc++.h> using namespace std; typedef pair<int ...
- Android studio 时间选择器
相当简单加载 gradle文件然后做一个textview即可. 1.首先我们要在build.gradle中写上这一行代码: compile 'com.feezu.liuli:timeselector: ...