LFYZ-OJ ID: 1015 统计数字（NOIP2007）

分析

本体思路很简单：读入数据，排序、统计、输出。难点在于数据量较大，选择何种排序方法就极为重要，否则很容易发生内存或时间超限。可以考虑以下几种思路：

桶排序

桶排序是可以想到的最简单方法，可在O(n)的时间内一次性完成排序和统计：tong[number]++;，考虑到本题中被统计的数字的范围0~1.5*10^9，就需要至少1.5*10^9大小的桶，这样大的一个int数组所占用的内存空间为6*10^9字节（32位计算机中一个int为4个字节），即6G Byte，已经远远超了128M Byte的要求，故桶排序无法使用。
冒泡排序

冒泡排序是最简单的一种稳定性排序，时间复杂度为O(n²)。可以考虑将所有的数据读入一个数组中再进行排序、统计。根据题目已知n的范围：1~200000，按最坏情况考虑，O(n^2)=2*10^10，单核心CPU时钟频率数量级一般为GHz，即1s可以执行1*10^9条指令（这里仅为数量级上的估算，不同型号CPU在不同计算机系统下的具体计算速度是不一样的）。可见使用冒泡排序很难在1s内完成排序，需要更高效的排序方法。
插入排序

插入排序的时间复杂度也是O(n²)，但考虑这样一种情况，因为不相同的数字不超过10000个，对于已经存在的数字，我们简单的对其计数，对于不存在的数字，进行插入排序。具体分析如下：
- 对于不相同的数字，最多进行10000个插入操作，相当于10000个数字进行插入排序，所需时间为1*10^8，这是CPU在1s内能够完成的。
- 对于相同的数字，因为已经存在，只需要将其找出，并对其计数加1，如果使用顺程序查找的话，时间复杂度为O(n)，在10000个数字里面查找一个数字，最坏情况选需要10000次，那么在最糟糕情况下：统计200000个数字，其中有10000次为插入&排序操作，190000次为查找计数操作，这190000次消耗时间最多为190000*10000=1.9*10^9，远超CPU单位时间（1s）内的运算能力。为了减少这部分时间，考虑到我们是在一个已拍好序的序列中查找，因此可以使用折半查找，每次查找的次数最多为log10000，最多14次，那么190000次查询消耗时间最多为190000*14=2.66*10^6，耗时最够低，满足我们的要求。
- 算法思路如下：
  1. 初始化count=0，序列NUM[10001][2]={0};
  2. 读入一个数字number
  3. 在序列NUM中查找这个number并返回位置wz
  4. 如果wz==-1（不存在），将number以插入排序方式插入序列，count++
  5. 如果wz>0（存在），则该位置计数加1，NUM[wz][1]++;
  6. 返回第2步

该思路是在一边插入、一边排序、一边统计，代码见例程1。

快速排序

快速排序是一种很高效的排序方法：时间复杂度为nlogn，将n个数字进行排序的话最大时间为200000*log200000，约为3.6*10^6，可见效率极高，当然这个数字是最理想情况了，实际情况差点，但在数量级上一般不会差异过大。这里不再详细分析快速排序，可参考输油管道问题。代码见例程2。
使用algorithm算法库

如果允许使用algorithm算法库，问题就更简单了，直接使用sort函数，有人问这个sort函数使用了什么算法，这就复杂了：STL中的sort在普通快速排序的基础上进行了优化，它还结合了插入排序和堆排序。根据不同的数量级别以及不同情况，能自动选用合适的排序方法。当数据量较大时采用快速排序，分段递归。一旦分段后的数据量小于某个阀值，为避免递归调用带来过大的额外负荷，便会改用插入排序。而如果递归层次过深，有出现最坏情况的倾向，还会改用堆排序。晕了吧？要知道，C++中的STL模板库可都是聪明人写出来的……不打击你了，感兴趣的话，自己去下载STL的源代码学习学习吧，本题使用sort的代码见例程3。

例程1：插入排序和二分查找

#include<iostream>

using namespace std;

int a[10001][2];					//存储序列，a[i][0]为数字，a[i][1]为计数

int count=0;						//存储序列中的数字个数 

int find(int num){					//二分查找

	int low=1, high=count, middle;

	while(low<=high){

		middle=(low+high)/2;

		if(a[middle][0]==num)	return middle;

		if(num<a[middle][0])	high=middle-1;

		if(num>a[middle][0])	low=middle+1;

	}

	return -1;						//-1为未找到

}

int main(){

	int n;

	scanf("%d", &n);

	while(n>0){						//循环读入并处理n个数字

		int num, wz;				//num临时存放读入的数字，wz为t在a中的位置

		scanf("%d", &num);

		wz=find(num);

		if(wz==-1){					//t没找到，插入到a中

			int pos=++count;		//pos为新插入点值，作为哨兵进行插入排序

			a[pos][0]=num;

			a[pos][1]=1;

			while(pos>1 && a[pos][0]<a[pos-1][0]){

				int t=a[pos][0];

				a[pos][0]=a[pos-1][0];

				a[pos-1][0]=t;

				t=a[pos][1];

				a[pos][1]=a[pos-1][1];

				a[pos-1][1]=t;

			}

		}else a[wz][1]++;			//t找到了，计数加1

		n--;

	}

	for(int i=1; i<=count; i++)		//循环输出

		printf("%d %d\n", a[i][0], a[i][1]);

	return 0;

}

例程2：快速排序

#include<iostream>

using namespace std;

int a[200001];

void qsort(int l, int r){

	int i,j,m,p;

	i=l; j=r;                                   //i从左边开始找，j从右边开始找

	m=a[(l+r)/2];                               //m为枢轴

	while (i<=j)                                //循环条件

	{

		while (a[i]<m) i++;

		while (a[j]>m) j--;

		if (i<=j)

		{

			p=a[i]; a[i]=a[j]; a[j]=p;

			i++; j--;

		}

	}

	if (i<r) qsort(i,r);                        //递归和终止条件

	if (l<j) qsort(l,j);                        //递归和终止条件

}

int main(){

	int n;

	cin>>n;

	for(int i=1;i<=n;i++)	scanf("%d",&a[i]);

	qsort(1,n);

	for (int i=1, count=0; i<=n; ++i){

		count++;								//累加计数

		if((i==n) || (a[i]!=a[i+1])){			//如果是最后一个或者下个数字不等于当前数字

			printf("%d %d\n",a[i], count);		//输出

			count=0;							//count归0

		}

  	}

	return 0;

}

例程3：使用algorithm库中的sort算法

#include<iostream>

#include<algorithm>

using namespace std;

int main(){

  int n;

  int a[200001];

  scanf("%d",&n);

  for(int i=1; i<=n; ++i) scanf("%d",&a[i]);	//从下标1开始存放

  sort(a+1, a+n+1);								//sort排序

  for(int i=1,count=0; i<=n; ++i){

    count++;									//累加计数

	if ((i==n) || (a[i]!=a[i+1])){				//如果是最后一个或者下个数字不等于当前数字

		printf("%d %d\n",a[i], count);			//输出

		count=0;								//sum归0

	}

  }

  return 0;

}

LFYZ-OJ ID: 1015 统计数字（NOIP2007）的更多相关文章

统计数字noip2007
7909:统计数字总时间限制: 1000ms 内存限制: 65536kB 描述某次科研调查时得到了n个自然数,每个数均不超过1500000000(1.5*109).已知不相同的数不超过1000 ...
洛谷-统计数字-NOIP2007提高组复赛
题目描述 Description 某次科研调查时得到了n个自然数,每个数均不超过1500000000(1.5*10^9).已知不相同的数不超过10000个,现在需要统计这些自然数各自出现的次数,并按照 ...
【9207&&b701】统计数字(NOIP2007)
问题描述某次科研调查时得到了n个自然数,每个数均不超过1500000000 (1.5*109).已知不相同的数不超过10000个,现在需要统计这些自然数各自出现的次数,并按照自然数从小到大的顺序输出 ...
luogu1097统计数字[noip2007提高组Day1T1]
题目描述某次科研调查时得到了n个自然数,每个数均不超过1500000000(1.5*10^9).已知不相同的数不超过10000个,现在需要统计这些自然数各自出现的次数,并按照自然数从小到大的顺序输出 ...
NOIP2007 统计数字
1．统计数字 (count.pas/c/cpp) [问题描述] 某次科研调查时得到了 n 个自然数,每个数均不超过 1500000000(1.5*109).已知不相同的数不超过 10000 个,现在 ...
洛谷 P1097 统计数字
P1097 统计数字题目描述某次科研调查时得到了n个自然数,每个数均不超过1500000000(1.5*10^9).已知不相同的数不超过10000个,现在需要统计这些自然数各自出现的次数,并按照自 ...
【MFC】ID命名和数字约定
ID命名和数字约定 MFC ID 命名和数字约定需要满足以下要求: 提供对 Visual C++ 资源编辑器支持的 MFC 库和 MFC 应用程序中使用的一致的 ID 命名标准. 这样就可以轻松地对程 ...
lintcode 中等题：digits counts 统计数字
题目统计数字计算数字k在0到n中的出现的次数,k可能是0~9的一个值样例例如n=12,k=1,在 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],我们发现 ...
每日一练之排序算法(P1097 统计数字)
某次科研调查时得到了n个自然数,每个数均不超过1500000000(1.5×10^9).已知不相同的数不超过10000个,现在需要统计这些自然数各自出现的次数,并按照自然数从小到大的顺序输出统计结果. ...

随机推荐

Cs231n课堂内容记录-Lecture 8 深度学习框架
Lecture 8 Deep Learning Software 课堂笔记参见:https://blog.csdn.net/u012554092/article/details/78159316 今 ...
无法启动mysql服务”1067 进程意外终止”解决办法【简记】
本文章主要是总结了各种导致mysql提示无法启动MYSQL服务”1067 进程意外终止”的一些解决办法,有碰到mysql无法启动的同学可尝试参考. 在win7的服务器里开启MySql服务提示“wind ...
Saltstack_使用指南06_远程执行-指定目标
1. 主机规划 Targeting Minions文档 https://docs.saltstack.com/en/latest/contents.html 另请参见:自动化运维神器之saltstac ...
eclipse设置新建jsp默认编码格式utf-8
JS库创建
建立js库模板 (function (){ function $(){ alert("被调用到喽!"); /*alert()是JavaScript脚本语言中窗口window对象的一 ...
SpringBoot四大神器之Actuator
介绍 Spring Boot有四大神器,分别是auto-configuration.starters.cli.actuator,本文主要讲actuator.actuator是spring boot提供 ...
Linux 内核空间与用户空间
本文以 32 位系统为例介绍内核空间(kernel space)和用户空间(user space). 内核空间和用户空间对 32 位操作系统而言,它的寻址空间(虚拟地址空间,或叫线性地址空间)为 4 ...
c++stack类的用法
官方解释: LIFO stack Stacks are a type of container adaptor, specifically designed to operate in a LIFO ...
ELK的安装
首先得安装好Elasticsearch.Kibana和Logstash(这里全部使用rpm安装的是6.4.2版本,而且都是单机安装,暂时没有考虑分布式安装.) 服务器内存要求至少为4G,下图为运行起来 ...
8个Python高效数据分析的技巧
一行代码定义List 下面是使用For循环创建列表和用一行代码创建列表的对比. x = [1,2,3,4] out = [] for item in x: out.append(item**2) pr ...

LFYZ-OJ ID: 1015 统计数字（NOIP2007）

分析

例程1：插入排序和二分查找

例程2：快速排序

例程3：使用algorithm库中的sort算法

LFYZ-OJ ID: 1015 统计数字（NOIP2007）的更多相关文章

随机推荐

热门专题