81-数据流中位数

数字是不断进入数组的,在每次添加一个新的数进入数组的同时返回当前新数组的中位数。

说明

中位数的定义:

中位数是排序后数组的中间值,如果有数组中有n个数,则中位数为A[(n-1)/2]。

比如:数组A=[1,2,3]的中位数是2,数组A=[1,19]的中位数是1。

样例

持续进入数组的数的列表为:[1, 2, 3, 4, 5],则返回[1, 1, 2, 2, 3]

持续进入数组的数的列表为:[4, 5, 1, 3, 2, 6, 0],则返回 [4, 4, 4, 3, 3, 3, 3]

持续进入数组的数的列表为:[2, 20, 100],则返回[2, 2, 20]

挑战

时间复杂度为O(nlogn)

标签

优先队列 LintCode 版权所有 堆 谷歌

思路

参考http://www.cnblogs.com/easonliu/p/4441916.html

  • 使用一个最大堆 maxSet 与最小堆 minSet( maxSet 用 multiset 的反向遍历代替)。maxSet 存的是到目前为止较小的那一半数,minSet 存的是到目前为止较大的那一半数,这样中位数只有可能是 maxSet 的堆顶元素(本题中)或者是两个堆顶元素的均值。
  • minSet与maxSet交替使用,保证两个堆的大小之差不超过1。
  • 当插入一个新数时,若新数大于 minSet 的堆顶元素,说明新数在所有数的下半部分,此时将新数插入 minSet,取出 minSet 堆顶元素并插入至 maxSet ;否则,说明新数在所有数的上半部分,将新数插入 maxSet
  • 当插入一个新数时,若新数小于 maxSet 的堆顶元素,说明新数在所有数的上半部分,此时将新数插入 maxSet,取出 maxSet 堆顶元素并插入至 minSet ;否则,说明新数在所有数的下半部分,将新数插入 minSet
  • 将 maxSet 堆顶元素存入返回值数组,但不取出堆顶元素

code

  1. class Solution {
  2. public:
  3. /**
  4. * @param nums: A list of integers.
  5. * @return: The median of numbers
  6. */
  7. vector<int> medianII(vector<int> &nums) {
  8. // write your code here
  9. int size = nums.size();
  10. if (size <= 0) {
  11. return vector<int>();
  12. }
  13. // maxSet存的是到目前为止较小的那一半数,minSet存的是到目前为止较大的那一半数
  14. // maxSet使用反向遍历,达到最大堆效果
  15. multiset<int> minSet, maxSet;
  16. vector<int> result;
  17. bool flag = true;
  18. for (int i = 0; i < size; i++) {
  19. int temp = nums[i];
  20. // minSet与maxSet交替使用,保证两个堆的大小之差不超过1
  21. if (flag) {
  22. // 新数大于minSet的堆顶元素时,说明新数在所有数的下半部分
  23. if (!minSet.empty() && nums[i] > *minSet.begin()) {
  24. minSet.insert(nums[i]);
  25. temp = *minSet.begin();
  26. minSet.erase(minSet.find(temp));
  27. }
  28. // 新数小于minSet的堆顶元素时,说明新数在所有数的上半部分
  29. // 或将原minSet的堆顶元素放在maxSet中
  30. maxSet.insert(temp);
  31. }
  32. else {
  33. // 新数小于minSet的堆顶元素时,说明新数在所有数的上半部分
  34. if (!maxSet.empty() && nums[i] < *maxSet.rbegin()) {
  35. maxSet.insert(nums[i]);
  36. temp = *maxSet.rbegin();
  37. maxSet.erase(maxSet.find(temp));
  38. }
  39. // 新数大于minSet的堆顶元素时,说明新数在所有数的下半部分
  40. // 或将原maxSet的堆顶元素放在minSet中
  41. minSet.insert(temp);
  42. }
  43. flag = !flag;
  44. result.push_back(*maxSet.rbegin());
  45. }
  46. return result;
  47. }
  48. };

lintcode-81-数据流中位数的更多相关文章

  1. 问题: 数据流中位数 求解 时间复杂度度 java

    今天练习了一题: 数据流中位数 问题描述:数字是不断进入数组的,在每次添加一个新的数进入数组的同时返回当前新数组的中位数. 案例: 持续进入数组的数的列表为:[1, 2, 3, 4, 5],则返回[1 ...

  2. 数据流中位数 · data stream median

    [抄题]: 数字是不断进入数组的,在每次添加一个新的数进入数组的同时返回当前新数组的中位数. [思维问题]: [一句话思路]: 左边x个元素,右边要有x+1个元素,因此利用maxheap把左边的最大值 ...

  3. 剑指offer 最小的k个数 、 leetcode 215. Kth Largest Element in an Array 、295. Find Median from Data Stream(剑指 数据流中位数)

    注意multiset的一个bug: multiset带一个参数的erase函数原型有两种.一是传递一个元素值,如上面例子代码中,这时候删除的是集合中所有值等于输入值的元素,并且返回删除的元素个数:另外 ...

  4. lintcode算法周竞赛

    ------------------------------------------------------------第七周:Follow up question 1,寻找峰值 寻找峰值 描述 笔记 ...

  5. 7九章算法强化班全解--------Hadoop跃爷Spark

    ------------------------------------------------------------第七周:Follow up question 1,寻找峰值 寻找峰值 描述 笔记 ...

  6. 剑指offer ------ 刷题总结

    面试题3 -- 搜索二维矩阵 写出一个高效的算法来搜索 m × n矩阵中的值. 这个矩阵具有以下特性: 1. 每行中的整数从左到右是排序的. 2. 每行的第一个数大于上一行的最后一个整数. publi ...

  7. [OJ] Data Stream Median (Hard)

    LintCode 81. Data Stream Median (Hard) 思路: 用一个大根堆保存较小的一半数, 一个小根堆保存较大的一半数. 每次根据num和两个堆顶的数据决定往哪个堆里面放. ...

  8. 【LeetCode】4、Median of Two Sorted Arrays

    题目等级:Hard 题目描述:   There are two sorted arrays nums1 and nums2 of size m and n respectively.   Find t ...

  9. 剑指Offer 1-41 代码(python实现)

    今天主要写了一下offer 1-41题,余下的稍后整理 1 """ 1 镜像二叉树: 递归 """ def mirror(root): if ...

  10. fasd

    基本排序算法 冒泡排序 没什么可说的, 改进方法就是加一个标志位防止有序后重复遍历. 由于需要遍历两次, 所以时间复杂度O(N^2) 传送门 --> 冒泡排序 选择排序 外层从0开始默认oute ...

随机推荐

  1. PHP接收post请求,不是空数组就是没值,怎么办!

    使用: $_POST $_REQUEST I('post.') 都不行, 换成: file_get_contents("php://input");

  2. STM32 HAL库学习系列第5篇 定时器TIM---编码器接口模式配置

    cube基本配置,外设开启编码器,串口2 可能大家在设置的时候有这个错误 错误:error:  #20: identifier "TIM_ICPOLARITY_BOTHEDGE" ...

  3. Python学习 :socket基础

    socket基础 什么是socket? - socket为接口通道,内部封装了IP地址.端口.协议等信息:我们可以看作是以前的通过电话机拨号上网的年代,socket即为电话线 socket通信流程 我 ...

  4. python七类之集合

    集合 一.关键字 : set 定义是 s = {}    #当里面没有元素的时候​​表现为字典数据类型 s = {} #空的{}代表空的字典,而不是集合 print(type(s)) 集合是不可哈希的 ...

  5. 基于visual studio 2017 以及cubemx 搭建stm32的开发环境(2)

    主要解决 vs2017中,printf无法打印数据的问题. 在keil环境下正常使用printf功能,但是以下的重定向代码在vs2017下使用不了: #ifdef __GNUC__ /* With G ...

  6. 理解 ajax、fetch和axios

    背景 ajax fetch.axios 优缺点 ajax基于jquery,引入时需要引入庞大的jquery库,不符合当下前端框架,于是fetch替代了ajax 由于fetch是比较底层,需要我们再次封 ...

  7. DP_最长公共子序列/动规入门

    学自:https://open.163.com/movie/2010/12/L/4/M6UTT5U0I_M6V2U1HL4.html 最长公共子序列:(本文先谈如何求出最长公共子序列的长度,求出最长公 ...

  8. 在Titanic数据集上应用AdaBoost元算法

    一.AdaBoost 元算法的基本原理 AdaBoost是adaptive boosting的缩写,就是自适应boosting.元算法是对于其他算法进行组合的一种方式. 而boosting是在从原始数 ...

  9. 20155301 2016-2017-2 《Java程序设计》第2周学习总结

    20155301 2016-2017-2 <Java程序设计>第2周学习总结 教材学习内容总结 教材的第三章内容主要分为两大方面: 一.程序中的数据类型,变量和运算符,主要讲述了各种类型的 ...

  10. # 20155337 2016-2017-2 《Java程序设计》第五周学习总

    20155337 2016-2017-2 <Java程序设计>第五周学习总结 教材学习内容总结 第八章 •语法与继承架构 •使用try.catch •特点: 使用try.catch语法,J ...