PAT 1029 Median (25分) 有序数组合并与防坑指南
题目
Given an increasing sequence S of N integers, the median is the number at the middle position. For example, the median of S1 = { 11, 12, 13, 14 } is 12, and the median of S2 = { 9, 10, 15, 16, 17 } is 15. The median of two sequences is defined to be the median of the nondecreasing sequence which contains all the elements of both sequences. For example, the median of S1 and S2 is 13.
Given two increasing sequences of integers, you are asked to find their median.
Input Specification:
Each input file contains one test case. Each case occupies 2 lines, each gives the information of a sequence. For each sequence, the first positive integer N (≤2×105) is the size of that sequence. Then N integers follow, separated by a space. It is guaranteed that all the integers are in the range of long int.
Output Specification:
For each test case you should output the median of the two given sequences in a line.
Sample Input:
4 11 12 13 14
5 9 10 15 16 17
Sample Output:
13
题目解读
首先,给出递增序列中位数的定义,奇数个元素不用多说,就是最中间那个;对于偶数个元素,比如 1 2 3 4
,定义2
是中位数(平常可能会(2+3)/ 2
,这里不是)。
两行输入,每一行第一个数字n
是序列个数,后面是n
个数字的递增序列。
要求输出这两个递增序列合并后的序列的中位数。
补:虽然题目说数组元素范围不超过long int
,但其实我试了一下用int
就可以了。
思路解析
- 关于两个递增序列合并的问题我就不多说了,无非就是每次比较两个序列当前元素,选择较小的那个放入新的序列,然后被选取的那个序列的指针和最后得到的序列的指针顺序后移一位。大体框架是这样的:
while (i < n && j < m) {
c[k++] = a[i] < b[j] ? a[i++] : b[j++];
}
if (i < n) {
while (i < n) {
c[k++] = a[i++];
}
} else if (j < m) {
while (j < m) {
c[k++] = b[j++];
}
}
- 然后就是中位数的选择问题,一共有
n + m
个元素,最中间的那个就是第(n + m + 1)/ 2
个数字,为什么要加1
,比如1 2 3 4 5 6 7,7 / 2 = 3
,但是4
是中位数,4
是第四个元素,当然你如果要按下标来说的话,4
的下标的确是3
,不用加1再除以2. - 第一种思路就是创建第三个数组
c[a.size()+b.size()]
,按照我上面写的代码把a[]
和b[]
顺序合并到c
中,然后输出c
的中位数(c[(m+n)/2])
。但是这种方式提交后最后一个测试点是运行超时,其实是内存溢出了。 - 我们考虑一下,首先,假如第
mid
个数字是c[]
的中位数,那么我们是不需要c[]
中mid
之后的写那些数字,那么我们在合并a
和b
的时候,记录一下当前合并了几个数字,当合并到第mid
个数时就退出while
;那么关于mid
前面的那些元素我们也是不需要保存的,我们只需要一个变量,每次它都被赋值为a[]
和b[]
中当前最小的那个,当合并到第mid次
时,这个变量就是我们需要的中位数。
while (i < n && j < m) {
// 每次找a和b当前位置小的那个那个元素
res = a[i] < b[j] ? a[i++] : b[j++];
// 得到了mid个就退出
if (++cnt == mid) break;
}
- 这里有两个问题:第一个是这个
mid
的取值,还记得我们上面那个1234567
的例子吗,我们这里是按照当前统计到第几个数字了来记录的,中位数是第4
个,所以mid =(n+m+1)/2;
第二个问题是:如果a和b中一个特别短呢?比如a[] : 2,b[] : 1 3 5 7
。这样的话while
退出就可能是a
和b
中某个数组合并完了,但是还没达到第mid
个,就拿这个例子来说,到while
退出时,我们应该是先选择1,再选择2,然后a合并完了,while退出了,但此时我们的cnt
只记录到2
,所以我们还差mid-cnt
个数字,所以我们应该去b
里面继续向后推进mid-cnt
个位置,得到中位数。
// while退出后
if (cnt < mid) {
// b[]数组全部元素合并过了不够mid个,已经得到了cnt个,还差 mid - cnt个
// 应该在a[]第i个的基础上向后移mid - cnt个位置,但是 【第几个】 和 【下标】 之间是差了个1的。
if (i < n)
res = a[i + mid - cnt - 1];
else
res = b[j + mid - cnt - 1];
}
注意事项(重点)
- 不要用三个数组,
a[200000],b[200000],c[400000]
,会内存溢出。 - 注意数组【第几个】元素与【下标】之间是差了个
1
的,实在不知道要不要加1
或减1
就写个例子试一下。 - 不要用
cin
输入,亲测,最后一个测试点依然是运行超时。
最终代码
#include <iostream>
using namespace std;
// 定义三个数组会溢出
// 用cin会溢出
int main() {
int n, m, i, j, res, cnt, mid, a[200000], b[200000];
// 第一组有n个数
// cin >> n;
scanf("%d", &n);
// for (i = 0; i < n; ++i) cin >> a[i];
for (i = 0; i < n; ++i) scanf("%d", &a[i]);
// cin >> m;
scanf("%d", &m);
// 第二组有m个数
// for (j = 0; j < m; ++j) cin >> b[j];
for (j = 0; j < m; ++j) scanf("%d", &a[j]);
// 合起来的一半有 假如 7 个 1 2 3 4 5 6 7,中位数是4,第4个数字
mid = (n + m + 1) / 2;
// cnt 得到第几个数
i = 0; j = 0, cnt = 0;
while (i < n && j < m) {
// 每次找a和b当前位置小的那个那个元素
res = a[i] < b[j] ? a[i++] : b[j++];
// 得到了mid个就退出
if (++cnt == mid) break;
}
// 判断退出条件
if (cnt < mid) {
// b[]数组全部元素合并过了不够mid个,已经得到了cnt个,还差 mid - cnt个
// 应该在a[]第i个的基础上向后移mid - cnt个位置,但是 【第几个】 和 【下标】 之间是差了个1的。
if (i < n)
res = a[i + mid - cnt - 1];
else
res = b[j + mid - cnt - 1];
}
cout << res;
return 0;
}
PAT 1029 Median (25分) 有序数组合并与防坑指南的更多相关文章
- PAT 甲级 1029 Median (25 分)(思维题,找两个队列的中位数,没想到)*
1029 Median (25 分) Given an increasing sequence S of N integers, the median is the number at the m ...
- 1029 Median (25 分)
1029 Median (25 分) Given an increasing sequence S of N integers, the median is the number at the m ...
- 【PAT甲级】1029 Median (25 分)
题意: 输入一个正整数N(<=2e5),接着输入N个非递减序的长整数. 输入一个正整数N(<=2e5),接着输入N个非递减序的长整数.(重复一次) 输出两组数合并后的中位数.(200ms, ...
- 1029 Median (25分)
Given an increasing sequence S of N integers, the median is the number at the middle position. For e ...
- PAT甲 1029. Median (25) 2016-09-09 23:11 27人阅读 评论(0) 收藏
1029. Median (25) 时间限制 1000 ms 内存限制 65536 kB 代码长度限制 16000 B 判题程序 Standard 作者 CHEN, Yue Given an incr ...
- java 有序数组合并
有序数组合并,例如: 数组 A=[100, 89, 88, 67, 65, 34], B=[120, 110, 103, 79, 66, 35, 20] 合并后的结果 result=[120, 110 ...
- 两个有序数组合并成一个有序数组(要求时间复杂度为O(n))
面试题: 怎样把两个有序数组合并成有序数组呢 逻辑步骤: 1.假设两个数组为A和B 2.A和B都是从小到大的顺序进行排列 ** 1.我们可以直接比较两个数组的首元素,哪个小就把这个小元素放入可变数组. ...
- PAT 甲级 1052 Linked List Sorting (25 分)(数组模拟链表,没注意到不一定所有节点都在链表里)
1052 Linked List Sorting (25 分) A linked list consists of a series of structures, which are not ne ...
- PAT 1029 Median[求中位数][难]
1029 Median(25 分) Given an increasing sequence S of N integers, the median is the number at the midd ...
随机推荐
- codeforce 227D Naughty Stone Piles (贪心+递归+递推)
Description There are n piles of stones of sizes a1, a2, -, an lying on the table in front of you. D ...
- P2762 太空飞行计划问题 网络流
题目描述 W 教授正在为国家航天中心计划一系列的太空飞行.每次太空飞行可进行一系列商业性实验而获取利润.现已确定了一个可供选择的实验集合E={E1,E2,…,Em},和进行这些实验需要使用的全部仪器的 ...
- 2018面向对象程序设计(Java)学习进度条
周次 (阅读/编写)代码行数 发布博客量/评论他人博客数量 课堂/课余学习时间(小时) 最满意的编程任务 第一周 200/30 1/0 6/3 九九乘法表 第二周 200/30 1/0 4/3 实验2 ...
- 201771010113 李婷华 《面向对象程序设计(Java)》第六周总结
一.理论知识部分 第四章 类与对象 1.方法的定义:方法声明和方法体. 2.重载:一个类中可以有多个方法具有相同的名字,不同的类型,不同的参数. 3.构造器:也叫构造方法,是类中的一种特殊的方法,其作 ...
- 【Hadoop离线基础总结】MapReduce入门
MapReduce入门 Mapreduce思想 概述 MapReduce的思想核心是分而治之,适用于大量复杂的任务处理场景(大规模数据处理场景). 最主要的特点就是把一个大的问题,划分成很多小的子问题 ...
- 解决编码问题:AttributeError: 'str' object has no attribute 'decode'
1. 问题发现: 出现:读取文件,对其进行解码,出现错误,AttributeError: 'str' object has no attribute 'decode' 解释:属性错误,str对象不包含 ...
- Scala 中 Any 类源码
package scalaabstract class Any { def equals(that: Any): Boolean //值比较 def hashCode(): Int //hash值 d ...
- Git使用教程之从远程库克隆项目(四)
我们接下来在本地新建一个文件夹,把刚刚github上创建的项目克隆下来,操作步骤如下: 1.克隆项目: 找到github上面的SSH地址,如图: 开始克隆: $ git clone git@githu ...
- 0804_serial port
其实这个程序总的来说是有问题的 仿真图: MacroAndConst.h #ifndef _MACRO_AND_CONST_H_ #define _MACRO_AND_CONST_H_ typedef ...
- 在ef core中使用postgres数据库的全文检索功能实战
起源 之前做的很多项目都使用solr/elasticsearch作为全文检索引擎,它们功能全面而强大,但是对于较小的项目而言,构建和维护成本显然过高,尤其是从关系数据库/文档数据库到全文检索引擎的数据 ...