分析

本体思路很简单:读入数据,排序、统计、输出。难点在于数据量较大,选择何种排序方法就极为重要,否则很容易发生内存或时间超限。可以考虑以下几种思路:

  1. 桶排序

    桶排序是可以想到的最简单方法,可在O(n)的时间内一次性完成排序和统计:tong[number]++;,考虑到本题中被统计的数字的范围0~1.5*10^9,就需要至少1.5*10^9大小的桶,这样大的一个int数组所占用的内存空间为6*10^9字节(32位计算机中一个int为4个字节),即6G Byte,已经远远超了128M Byte的要求,故桶排序无法使用。

  2. 冒泡排序

    冒泡排序是最简单的一种稳定性排序,时间复杂度为O(n2)。可以考虑将所有的数据读入一个数组中再进行排序、统计。根据题目已知n的范围:1~200000,按最坏情况考虑,O(n^2)=2*10^10,单核心CPU时钟频率数量级一般为GHz,即1s可以执行1*10^9条指令(这里仅为数量级上的估算,不同型号CPU在不同计算机系统下的具体计算速度是不一样的)。可见使用冒泡排序很难在1s内完成排序,需要更高效的排序方法。

  3. 插入排序

    插入排序的时间复杂度也是O(n2),但考虑这样一种情况,因为不相同的数字不超过10000个,对于已经存在的数字,我们简单的对其计数,对于不存在的数字,进行插入排序。具体分析如下:

    • 对于不相同的数字,最多进行10000个插入操作,相当于10000个数字进行插入排序,所需时间为1*10^8,这是CPU在1s内能够完成的。
    • 对于相同的数字,因为已经存在,只需要将其找出,并对其计数加1,如果使用顺程序查找的话,时间复杂度为O(n),在10000个数字里面查找一个数字,最坏情况选需要10000次,那么在最糟糕情况下:统计200000个数字,其中有10000次为插入&排序操作,190000次为查找计数操作,这190000次消耗时间最多为190000*10000=1.9*10^9,远超CPU单位时间(1s)内的运算能力。为了减少这部分时间,考虑到我们是在一个已拍好序的序列中查找,因此可以使用折半查找,每次查找的次数最多为log10000,最多14次,那么190000次查询消耗时间最多为190000*14=2.66*10^6,耗时最够低,满足我们的要求。
    • 算法思路如下:
      1. 初始化count=0,序列NUM[10001][2]={0};
      2. 读入一个数字number
      3. 在序列NUM中查找这个number并返回位置wz
      4. 如果wz==-1(不存在),将number以插入排序方式插入序列,count++
      5. 如果wz>0(存在),则该位置计数加1,NUM[wz][1]++;
      6. 返回第2步

该思路是在一边插入、一边排序、一边统计,代码见例程1。

  1. 快速排序

    快速排序是一种很高效的排序方法:时间复杂度为nlogn,将n个数字进行排序的话最大时间为200000*log200000,约为3.6*10^6,可见效率极高,当然这个数字是最理想情况了,实际情况差点,但在数量级上一般不会差异过大。这里不再详细分析快速排序,可参考输油管道问题。代码见例程2。

  2. 使用algorithm算法库

    如果允许使用algorithm算法库,问题就更简单了,直接使用sort函数,有人问这个sort函数使用了什么算法,这就复杂了:STL中的sort在普通快速排序的基础上进行了优化,它还结合了插入排序和堆排序。根据不同的数量级别以及不同情况,能自动选用合适的排序方法。当数据量较大时采用快速排序,分段递归。一旦分段后的数据量小于某个阀值,为避免递归调用带来过大的额外负荷,便会改用插入排序。而如果递归层次过深,有出现最坏情况的倾向,还会改用堆排序。晕了吧?要知道,C++中的STL模板库可都是聪明人写出来的……不打击你了,感兴趣的话,自己去下载STL的源代码学习学习吧,本题使用sort的代码见例程3。

例程1:插入排序和二分查找

#include<iostream>
using namespace std; int a[10001][2]; //存储序列,a[i][0]为数字,a[i][1]为计数
int count=0; //存储序列中的数字个数 int find(int num){ //二分查找
int low=1, high=count, middle;
while(low<=high){
middle=(low+high)/2;
if(a[middle][0]==num) return middle;
if(num<a[middle][0]) high=middle-1;
if(num>a[middle][0]) low=middle+1;
}
return -1; //-1为未找到
} int main(){
int n;
scanf("%d", &n);
while(n>0){ //循环读入并处理n个数字
int num, wz; //num临时存放读入的数字,wz为t在a中的位置
scanf("%d", &num);
wz=find(num);
if(wz==-1){ //t没找到,插入到a中
int pos=++count; //pos为新插入点值,作为哨兵进行插入排序
a[pos][0]=num;
a[pos][1]=1;
while(pos>1 && a[pos][0]<a[pos-1][0]){
int t=a[pos][0];
a[pos][0]=a[pos-1][0];
a[pos-1][0]=t;
t=a[pos][1];
a[pos][1]=a[pos-1][1];
a[pos-1][1]=t;
}
}else a[wz][1]++; //t找到了,计数加1
n--;
}
for(int i=1; i<=count; i++) //循环输出
printf("%d %d\n", a[i][0], a[i][1]);
return 0;
}

例程2:快速排序

#include<iostream>
using namespace std; int a[200001];
void qsort(int l, int r){
int i,j,m,p;
i=l; j=r; //i从左边开始找,j从右边开始找
m=a[(l+r)/2]; //m为枢轴
while (i<=j) //循环条件
{
while (a[i]<m) i++;
while (a[j]>m) j--;
if (i<=j)
{
p=a[i]; a[i]=a[j]; a[j]=p;
i++; j--;
}
}
if (i<r) qsort(i,r); //递归和终止条件
if (l<j) qsort(l,j); //递归和终止条件
} int main(){
int n;
cin>>n;
for(int i=1;i<=n;i++) scanf("%d",&a[i]);
qsort(1,n);
for (int i=1, count=0; i<=n; ++i){
count++; //累加计数
if((i==n) || (a[i]!=a[i+1])){ //如果是最后一个或者下个数字不等于当前数字
printf("%d %d\n",a[i], count); //输出
count=0; //count归0
}
}
return 0;
}

例程3:使用algorithm库中的sort算法

#include<iostream>
#include<algorithm>
using namespace std; int main(){
int n;
int a[200001];
scanf("%d",&n);
for(int i=1; i<=n; ++i) scanf("%d",&a[i]); //从下标1开始存放
sort(a+1, a+n+1); //sort排序
for(int i=1,count=0; i<=n; ++i){
count++; //累加计数
if ((i==n) || (a[i]!=a[i+1])){ //如果是最后一个或者下个数字不等于当前数字
printf("%d %d\n",a[i], count); //输出
count=0; //sum归0
}
}
return 0;
}

LFYZ-OJ ID: 1015 统计数字(NOIP2007)的更多相关文章

  1. 统计数字noip2007

    7909:统计数字 总时间限制:  1000ms 内存限制:  65536kB 描述 某次科研调查时得到了n个自然数,每个数均不超过1500000000(1.5*109).已知不相同的数不超过1000 ...

  2. 洛谷-统计数字-NOIP2007提高组复赛

    题目描述 Description 某次科研调查时得到了n个自然数,每个数均不超过1500000000(1.5*10^9).已知不相同的数不超过10000个,现在需要统计这些自然数各自出现的次数,并按照 ...

  3. 【9207&&b701】统计数字(NOIP2007)

    问题描述 某次科研调查时得到了n个自然数,每个数均不超过1500000000 (1.5*109).已知不相同的数不超过10000个,现在需要统计这些自然数各自出现的次数,并按照自然数从小到大的顺序输出 ...

  4. luogu1097统计数字[noip2007提高组Day1T1]

    题目描述 某次科研调查时得到了n个自然数,每个数均不超过1500000000(1.5*10^9).已知不相同的数不超过10000个,现在需要统计这些自然数各自出现的次数,并按照自然数从小到大的顺序输出 ...

  5. NOIP2007 统计数字

    1.统计数字 (count.pas/c/cpp) [问题描述] 某次科研调查时得到了 n 个自然数,每个数均不超过 1500000000(1.5*109).已知不相同的数 不超过 10000 个,现在 ...

  6. 洛谷 P1097 统计数字

    P1097 统计数字 题目描述 某次科研调查时得到了n个自然数,每个数均不超过1500000000(1.5*10^9).已知不相同的数不超过10000个,现在需要统计这些自然数各自出现的次数,并按照自 ...

  7. 【MFC】ID命名和数字约定

    ID命名和数字约定 MFC ID 命名和数字约定需要满足以下要求: 提供对 Visual C++ 资源编辑器支持的 MFC 库和 MFC 应用程序中使用的一致的 ID 命名标准. 这样就可以轻松地对程 ...

  8. lintcode 中等题:digits counts 统计数字

    题目 统计数字 计算数字k在0到n中的出现的次数,k可能是0~9的一个值 样例 例如n=12,k=1,在 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],我们发现 ...

  9. 每日一练之排序算法(P1097 统计数字)

    某次科研调查时得到了n个自然数,每个数均不超过1500000000(1.5×10^9).已知不相同的数不超过10000个,现在需要统计这些自然数各自出现的次数,并按照自然数从小到大的顺序输出统计结果. ...

随机推荐

  1. 阿里云上的Centos 7.6的一次Nginx+Mysql+PHP7.3 部署

    阿里云申请了一台服务器 Centos 7.6,每次安装都要上网找一大堆教程,因为不熟悉,因为总是忘记. 所以,有时间的时候,还是记录下自己的学习过程,有助于下次的问题解决. 我先总结下: 1)安装VS ...

  2. logrotate异常排查

    [root@dev240 logrotate.d]# /usr/sbin/logrotate -v /etc/logrotate.conf reading config file /etc/logro ...

  3. linux性能监控命令(vmstat、sar、iostat、netstat)

    1.常用系统命令Vmstat.sar.iostat.netstat.free.ps.top等 2.常用组合方式• 用vmstat.sar.iostat检测是否是CPU瓶颈• 用free.vmstat检 ...

  4. 实现一个book类

    设计实现一个book类 具体要求 定义义成Book.java,Book 包含书名,作者,出版社和出版日期,这些数据都要定义getter和setter. 定义至少三个构造方法,接收并初始化这些数据. 覆 ...

  5. 03-JavaScript之数据类型

    JavaScript之数据类型 1.介绍 JavaScript数据类型分为两类:原始类型(primitive type)和对象类型(object type) 2.原始类型 数字 - number.字符 ...

  6. MySQL8.0-NoSQL和SQL的对比及MySQL的优势

    一.SQL VS NoSQL SQL:关系型数据库,用SQL语句来操作数据 NOSQL:非关系型数据库,NoSQL的含义是不仅仅有SQL,而实际上大多数NoSQL不用SQL来操作数据 常见的关系型数据 ...

  7. Python——字符格式化

    一.分类:%格式符方式,format方式 二.%格式符 1.%s——字符占位,%d——数字占位(十进制) a = ("%(name)s--%(age)d" % {'name':'x ...

  8. idea打开项目,没有项目文件,文件报红

    删除项目文件夹中的.idea文件,重启idea,再执行如下操作.

  9. Raspberry pi connect temperature and humidity to onenet (移动云平台)

    工具 树莓派3 modelB 一个 dht11温湿度传感器一个  onenet平台 安装好requests库的python(一定要安装好不然代码不能正确运行,可以参考我的另一篇博文点击打开链接) 树莓 ...

  10. Python量化交易

    资料整理: 1.python量化的一个github 代码 2.原理 + python基础 讲解 3.目前发现不错的两个量化交易 学习平台: 聚宽和优矿在量化交易都是在15年线上布局的,聚宽是15年的新 ...