lintcode-81-数据流中位数
81-数据流中位数
数字是不断进入数组的,在每次添加一个新的数进入数组的同时返回当前新数组的中位数。
说明
中位数的定义:
中位数是排序后数组的中间值,如果有数组中有n个数,则中位数为A[(n-1)/2]。
比如:数组A=[1,2,3]的中位数是2,数组A=[1,19]的中位数是1。样例
持续进入数组的数的列表为:[1, 2, 3, 4, 5],则返回[1, 1, 2, 2, 3]
持续进入数组的数的列表为:[4, 5, 1, 3, 2, 6, 0],则返回 [4, 4, 4, 3, 3, 3, 3]
持续进入数组的数的列表为:[2, 20, 100],则返回[2, 2, 20]挑战
时间复杂度为O(nlogn)
标签
优先队列 LintCode 版权所有 堆 谷歌
思路
- 使用一个最大堆 maxSet 与最小堆 minSet( maxSet 用 multiset 的反向遍历代替)。maxSet 存的是到目前为止较小的那一半数,minSet 存的是到目前为止较大的那一半数,这样中位数只有可能是 maxSet 的堆顶元素(本题中)或者是两个堆顶元素的均值。
- minSet与maxSet交替使用,保证两个堆的大小之差不超过1。
- 当插入一个新数时,若新数大于 minSet 的堆顶元素,说明新数在所有数的下半部分,此时将新数插入 minSet,取出 minSet 堆顶元素并插入至 maxSet ;否则,说明新数在所有数的上半部分,将新数插入 maxSet
- 当插入一个新数时,若新数小于 maxSet 的堆顶元素,说明新数在所有数的上半部分,此时将新数插入 maxSet,取出 maxSet 堆顶元素并插入至 minSet ;否则,说明新数在所有数的下半部分,将新数插入 minSet
- 将 maxSet 堆顶元素存入返回值数组,但不取出堆顶元素
code
class Solution {
public:
/**
* @param nums: A list of integers.
* @return: The median of numbers
*/
vector<int> medianII(vector<int> &nums) {
// write your code here
int size = nums.size();
if (size <= 0) {
return vector<int>();
}
// maxSet存的是到目前为止较小的那一半数,minSet存的是到目前为止较大的那一半数
// maxSet使用反向遍历,达到最大堆效果
multiset<int> minSet, maxSet;
vector<int> result;
bool flag = true;
for (int i = 0; i < size; i++) {
int temp = nums[i];
// minSet与maxSet交替使用,保证两个堆的大小之差不超过1
if (flag) {
// 新数大于minSet的堆顶元素时,说明新数在所有数的下半部分
if (!minSet.empty() && nums[i] > *minSet.begin()) {
minSet.insert(nums[i]);
temp = *minSet.begin();
minSet.erase(minSet.find(temp));
}
// 新数小于minSet的堆顶元素时,说明新数在所有数的上半部分
// 或将原minSet的堆顶元素放在maxSet中
maxSet.insert(temp);
}
else {
// 新数小于minSet的堆顶元素时,说明新数在所有数的上半部分
if (!maxSet.empty() && nums[i] < *maxSet.rbegin()) {
maxSet.insert(nums[i]);
temp = *maxSet.rbegin();
maxSet.erase(maxSet.find(temp));
}
// 新数大于minSet的堆顶元素时,说明新数在所有数的下半部分
// 或将原maxSet的堆顶元素放在minSet中
minSet.insert(temp);
}
flag = !flag;
result.push_back(*maxSet.rbegin());
}
return result;
}
};
lintcode-81-数据流中位数的更多相关文章
- 问题: 数据流中位数 求解 时间复杂度度 java
今天练习了一题: 数据流中位数 问题描述:数字是不断进入数组的,在每次添加一个新的数进入数组的同时返回当前新数组的中位数. 案例: 持续进入数组的数的列表为:[1, 2, 3, 4, 5],则返回[1 ...
- 数据流中位数 · data stream median
[抄题]: 数字是不断进入数组的,在每次添加一个新的数进入数组的同时返回当前新数组的中位数. [思维问题]: [一句话思路]: 左边x个元素,右边要有x+1个元素,因此利用maxheap把左边的最大值 ...
- 剑指offer 最小的k个数 、 leetcode 215. Kth Largest Element in an Array 、295. Find Median from Data Stream(剑指 数据流中位数)
注意multiset的一个bug: multiset带一个参数的erase函数原型有两种.一是传递一个元素值,如上面例子代码中,这时候删除的是集合中所有值等于输入值的元素,并且返回删除的元素个数:另外 ...
- lintcode算法周竞赛
------------------------------------------------------------第七周:Follow up question 1,寻找峰值 寻找峰值 描述 笔记 ...
- 7九章算法强化班全解--------Hadoop跃爷Spark
------------------------------------------------------------第七周:Follow up question 1,寻找峰值 寻找峰值 描述 笔记 ...
- 剑指offer ------ 刷题总结
面试题3 -- 搜索二维矩阵 写出一个高效的算法来搜索 m × n矩阵中的值. 这个矩阵具有以下特性: 1. 每行中的整数从左到右是排序的. 2. 每行的第一个数大于上一行的最后一个整数. publi ...
- [OJ] Data Stream Median (Hard)
LintCode 81. Data Stream Median (Hard) 思路: 用一个大根堆保存较小的一半数, 一个小根堆保存较大的一半数. 每次根据num和两个堆顶的数据决定往哪个堆里面放. ...
- 【LeetCode】4、Median of Two Sorted Arrays
题目等级:Hard 题目描述: There are two sorted arrays nums1 and nums2 of size m and n respectively. Find t ...
- 剑指Offer 1-41 代码(python实现)
今天主要写了一下offer 1-41题,余下的稍后整理 1 """ 1 镜像二叉树: 递归 """ def mirror(root): if ...
- fasd
基本排序算法 冒泡排序 没什么可说的, 改进方法就是加一个标志位防止有序后重复遍历. 由于需要遍历两次, 所以时间复杂度O(N^2) 传送门 --> 冒泡排序 选择排序 外层从0开始默认oute ...
随机推荐
- PHP接收post请求,不是空数组就是没值,怎么办!
使用: $_POST $_REQUEST I('post.') 都不行, 换成: file_get_contents("php://input");
- STM32 HAL库学习系列第5篇 定时器TIM---编码器接口模式配置
cube基本配置,外设开启编码器,串口2 可能大家在设置的时候有这个错误 错误:error: #20: identifier "TIM_ICPOLARITY_BOTHEDGE" ...
- Python学习 :socket基础
socket基础 什么是socket? - socket为接口通道,内部封装了IP地址.端口.协议等信息:我们可以看作是以前的通过电话机拨号上网的年代,socket即为电话线 socket通信流程 我 ...
- python七类之集合
集合 一.关键字 : set 定义是 s = {} #当里面没有元素的时候表现为字典数据类型 s = {} #空的{}代表空的字典,而不是集合 print(type(s)) 集合是不可哈希的 ...
- 基于visual studio 2017 以及cubemx 搭建stm32的开发环境(2)
主要解决 vs2017中,printf无法打印数据的问题. 在keil环境下正常使用printf功能,但是以下的重定向代码在vs2017下使用不了: #ifdef __GNUC__ /* With G ...
- 理解 ajax、fetch和axios
背景 ajax fetch.axios 优缺点 ajax基于jquery,引入时需要引入庞大的jquery库,不符合当下前端框架,于是fetch替代了ajax 由于fetch是比较底层,需要我们再次封 ...
- DP_最长公共子序列/动规入门
学自:https://open.163.com/movie/2010/12/L/4/M6UTT5U0I_M6V2U1HL4.html 最长公共子序列:(本文先谈如何求出最长公共子序列的长度,求出最长公 ...
- 在Titanic数据集上应用AdaBoost元算法
一.AdaBoost 元算法的基本原理 AdaBoost是adaptive boosting的缩写,就是自适应boosting.元算法是对于其他算法进行组合的一种方式. 而boosting是在从原始数 ...
- 20155301 2016-2017-2 《Java程序设计》第2周学习总结
20155301 2016-2017-2 <Java程序设计>第2周学习总结 教材学习内容总结 教材的第三章内容主要分为两大方面: 一.程序中的数据类型,变量和运算符,主要讲述了各种类型的 ...
- # 20155337 2016-2017-2 《Java程序设计》第五周学习总
20155337 2016-2017-2 <Java程序设计>第五周学习总结 教材学习内容总结 第八章 •语法与继承架构 •使用try.catch •特点: 使用try.catch语法,J ...