Description:

两个长度为 n 的数组 A 和 B, 各从中选出一个元素相加 A[i] + B[j], 求 top n 小的那些和。

思路 1:这样的和总共有 n^2 个, 排序,然后取前 n 个。

时间复杂度 O(n^2 lgn), 空间复杂度 O(n^2)

思路 2:用 最大堆

     1. 首先用 n 个和建立一个最大堆,

     2. 然后循环剩余的 n^2 - n 个和,依次与堆顶元素比较(最大值), 如果小于最大值,则弹出堆顶,push 进入当前的和。

         时间复杂度 O(n^2 lgn), 空间复杂度是 O(n)

思路3: 还是采用 最小堆,并采用 多路合并 的思路。

首先,分析多路合并问题: 把 K 个有序数组合并成一个数组。

1. 将 K 个数组的首元素(最小),建立一个最小堆;

     2. 弹出最小值,并插入新的数组中;将最小值所在的数组的下一个元素插入堆中。这样依次执行下去。

      多路合并的代码见 http://blog.csdn.net/shoulinjun/article/details/19576585



回到我们的问题,将 N^2 个 sum 写成如下的形式:

所有 N^2 个和:(数组 A 和 B 排序后)

A[0] + B[0] <= A[0] + B[1] <= A[0] + B[2] <= ... <= A[0] + B[n-1]

A[1] + B[0] <= A[1] + B[1] <= A[1] + B[2] <= ... <= A[1] + B[n-1]

...............................

A[n-1] + B[0] <= A[n-1] + B[1] <= A[n-1] + B[2] <= ... <= A[n-1] + B[n-1]

注意: 第一步将数组 A 和 B 排序,则上述的 N 个序列都是有序的。

Bingo! 这时就可以采用与 多路合并 同样的算法:

Algorithm:

1. 将数组 A 和 B 排序

     2. 用 上述 N 个序列的首元素(最小),建立一个最小堆;

     3. 弹出最小值,即为 top N;将最小值所在的数组的下一个元素插入堆中。这样执行 N 次, 得到 所有的 top N

Complexity:

O(NlgN) + O(N)+ N*O(lgN) = O(NlgN)

Implementation:

实现细节的话,算法的第 2 步中, 最小值所在的数组的下一个元素如何得到?? 可以同时记录最小值这个和中所包含的B 中元素的下标。

下一个元素的值就是 min - B[i] + B[i+1]

//copyright @ L.J.SHOU Feb.14, 2014
#include <iostream>
#include <vector>
#include <utility>
#include <queue>
#include <algorithm>
#include <iterator>
using namespace std; //A and B have the same size K
vector<int> TopKSum(vector<int> &A, vector<int> &B)
{
vector<int> result;
priority_queue<pair<int, int>, vector<pair<int, int> >, greater<pair<int, int> > > Q; /* sort */
sort(A.begin(), A.end());
sort(B.begin(), B.end()); for(int i=0; i<A.size(); ++i)
Q.push(make_pair(A[i] + B[0], 0)); /* 0 denotes index in B */ for(int i=0; i<A.size(); ++i)
{
pair<int, int> e = Q.top(); Q.pop();
    result.push_back(e.first);
    /* push next element back into heap */
    e.first = e.first - B[e.second] + B[e.second+1];
    e.second ++;
    Q.push(e);
} return result;
} int main(void)
{
vector<int> A, B, sum;
A.push_back(1);
A.push_back(2);
A.push_back(3); B.push_back(2);
B.push_back(4);
B.push_back(4); sum = TopKSum(A, B);
/* print vector */
copy(sum.begin(), sum.end(), ostream_iterator<int>(cout, " "));
cout << endl; return 0;
}

思考题:

n 个长度为 n 的数组,每个数组中选出一个元素相加, 求 top n 小的那些 sum。

复杂度: n^2 lgn

算法----序列和的 top N的更多相关文章

  1. 【机器学习】支持向量机(SVM)的优化算法——序列最小优化算法(SMO)概述

    SMO算法是一一种启发式算法,它的基本思路是如果所有变量的解的条件都满足最优化问题的KKT条件,那么这个最优化问题的解就得到了.因为KKT条件是该优化问题的充分必要条件. 整个SMO算法包括两个部分: ...

  2. MapReduce算法形式五:TOP—N

    案例五:TOP—N 这个问题比较常见,一般都用于求前几个或者后几个的问题,shuffle有一个默认的排序是正序的,但如果需要逆序的并且暂时还不知道如何重写shuffle的排序规则的时候就用以下方法就行 ...

  3. 经典算法(一) top k

    问题:1亿数据中,找出最大的k个数,要求使用内存不超过1m (延伸问题:1亿数据中,找出重复出现次数最多的k个,要求使用内存不超过1m 等) 分析: 1亿数字(int)占内存:100000000 * ...

  4. 必考算法之 Top K 问题

    大家好,这里是<齐姐聊算法>系列之 Top K 问题. Top K 问题是面试中非常常考的算法题. 8 Leetcode 上这两题大同小异,这里以第一题为例. 题意: 给一组词,统计出现频 ...

  5. Top K问题的两种解决思路

    Top K问题在数据分析中非常普遍的一个问题(在面试中也经常被问到),比如: 从20亿个数字的文本中,找出最大的前100个. 解决Top K问题有两种思路, 最直观:小顶堆(大顶堆 -> 最小1 ...

  6. 标签传播算法(Label Propagation Algorithm, LPA)初探

    0. 社区划分简介 0x1:非重叠社区划分方法 在一个网络里面,每一个样本只能是属于一个社区的,那么这样的问题就称为非重叠社区划分. 在非重叠社区划分算法里面,有很多的方法: 1. 基于模块度优化的社 ...

  7. 【决战西二旗】|理解Sort算法

    前言 前面两篇文章介绍了快速排序的基础知识和优化方向,今天来看一下STL中的sort算法的底层实现和代码技巧. 众所周知STL是借助于模板化来支撑数据结构和算法的通用化,通用化对于C++使用者来说已经 ...

  8. K-近邻算法kNN

    K-近邻算法(k-Nearest Neighbor,简称kNN)采用测量不同特征值之间的距离方法进行分类,是一种常用的监督学习方法,其工作机制很简单:给定测试样本,基于某种距离亮度找出训练集中与其靠近 ...

  9. c++模板库(简介)

    目 录 STL 简介 ......................................................................................... ...

随机推荐

  1. spring来了-03-bean创建细节

    对象创建:单例/多例  [bean节点的属性scope] scope="singleton", 默认值,即默认是单例     [service/dao/工具类] scope=&qu ...

  2. div中字垂直居中对齐

    div中的文本水平居中,一般都是用text-align:center;就可以解决,那么垂直居中呢,知道vertiacl-align:middle;但有时候却不起作用:整理下div中文本垂直居中对齐的问 ...

  3. FireFox背景亮度修改

    安装stylish 输入:body{filter: brightness(80%);}

  4. thinkphp @代表什么

    import('@.ORG.Util.RBAC'); @表示在同一目录下.看一下Lib目录下除了Action外,还有ORG目录.如果使用@.ORG.Util.RBAC,则表示RBAC是放在Lib/OR ...

  5. Struts、JSTL标签库的基本使用方法

    一 使用Struts标签之前需要经过下面3个步骤的配置. 1.导入TLD文件. 2.在web.xml中注册标签库. 3.在页面中引入标签库. 下面详细介绍以上步骤. 1 导入TLD文件. TLD文件是 ...

  6. Steam和Byte[]之间进行输换

    一. 二进制转换成图片 MemoryStream ms = new MemoryStream(bytes); ms.Position = 0; Image img = Image.FromStream ...

  7. Oracle 权限查询

    查看当前用户权限:SQL> select * from session_privs; 查询某个用户被赋予的系统权限. Select * from user_sys_privs; 或者: sele ...

  8. C#基础学习文章导航

    第一部分:入个门 C#入门篇-1:HelloWorld的类 C#入门篇-2:什么是变量 C#入门篇-3:数据类型及转换 C#入门篇-4:使用运算符 第二部分:流程控制语句 C#入门篇5-1:流程控制语 ...

  9. eclipse-mysql-tomcat bug之旅

    赶紧默念三遍google大法好... [连接数据库 servlet调用提示找不到可加载的driver,普通的.java文件没问题] 表示不服啊...明明可以连上啊...为什么多了几个中间界面就不好使了 ...

  10. su和su -和sudo

    1.su和sudo没有切换工作目录和环境变量,只是赋予用户权限, 而su -是真正切换到root登录,工作目录切换到/root,环境变量也同时改变. [root@oc3408554812 home]# ...