Top K问题-BFPRT算法、Parition算法

BFPRT算法原理

在BFPTR算法中，仅仅是改变了快速排序Partion中的pivot值的选取，在快速排序中，我们始终选择第一个元素或者最后一个元素作为pivot，而在BFPTR算法中，每次选择五分中位数的中位数作为pivot，这样做的目的就是使得划分比较合理，从而避免了最坏情况的发生。算法步骤如下

1. 将 $n$ 个元素划为 $\lfloor n/5\rfloor$ 组，每组5个，至多只有一组由 $n\bmod5$ 个元素组成。
2. 寻找这 $\lceil n/5\rceil$ 个组中每一个组的中位数，这个过程可以用插入排序。
3. 对步骤2中的 $\lceil n/5\rceil$ 个中位数，重复步骤1和步骤2，递归下去，直到剩下一个数字。 4. 最终剩下的数字即为pivot，把大于它的数全放左边，小于等于它的数全放右边。
5. 判断pivot的位置与k的大小，有选择的对左边或右边递归。

求第 $k$ 大就是求第 $n-k+1$ 小，这两者等价。

基于Partition算法

选择一个Position（称为基准），基于该算法的Top k算法，非常受Position好坏的影响，所谓的坏，有可能使时间复杂度达到O(n*n)。
然后利用Partition算法进行划分，如果Partition得到的p小于K，则继续划分p的右边，如果p大于K，则继续划分p的左边，如果p等于K，则算法结束。

作者：远o_O
链接：https://www.jianshu.com/p/495e5019669c
來源：简书
简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

Top K问题-BFPRT算法、Parition算法的更多相关文章

Top k问题（线性时间选择算法）
问题描述:给定n个整数,求其中第k小的数. 分析:显然,对所有的数据进行排序,即很容易找到第k小的数.但是排序的时间复杂度较高,很难达到线性时间,哈希排序可以实现,但是需要另外的辅助空间. 这里我提供 ...
top k问题
1.top k问题在海量数据处理中,经常会遇到的一类问题:在海量数据中找出出现频率最高的前k个数,或者从海量数据中找出最大的前k个数,这类问题通常被称为top K问题.例如,在搜索引擎中,统计搜索最 ...
程序员编程艺术：第三章续、Top K算法问题的实现
程序员编程艺术:第三章续.Top K算法问题的实现作者:July,zhouzhenren,yansha. 致谢:微软100题实现组,狂想曲创作组. 时间:2011年05月08日 ...
Top K算法
应用场景: 搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节. 假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果 ...
排序算法Java版，以及各自的复杂度，以及由堆排序产生的top K问题
常用的排序算法包括: 冒泡排序:每次在无序队列里将相邻两个数依次进行比较,将小数调换到前面, 逐次比较,直至将最大的数移到最后.最将剩下的N-1个数继续比较,将次大数移至倒数第二.依此规律,直至比较结 ...
Top K 算法详解
http://xingyunbaijunwei.blog.163.com/blog/static/7653806720111149318357/ 问题描述百度面试题: ...
hihoCoder 1133 二分·二分查找之k小数（TOP K算法）
#1133 : 二分·二分查找之k小数时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述在上一回里我们知道Nettle在玩<艦これ>,Nettle的镇守府有很 ...
算法题解：最大或最小的K个数（海量数据Top K问题）
题目输入 n 个整数,找出其中最小的 k 个数.例如输入4.5.1.6.2.7.3.8 这8个数字,则最小的4个数字是1.2.3.4. 初窥这道题最简单的思路莫过于把输入的 n 个整数排序,排序之 ...
算法题解：最小的K个数（海量数据Top K问题）
[本文版权归微信公众号"代码艺术"(ID:onblog)所有,若是转载请务必保留本段原创声明,违者必究.若是文章有不足之处,欢迎关注微信公众号私信与我进行交流!] 题目输入 n ...

随机推荐

Tomcat分析-启动过程
Server是Tomcat最顶层的容器 Service用于提供服务 Connector用于处理连接相关的事情,并提供Socket与request和response的转换 Container用于封装和管 ...
Java json字符串对比
public class JsonUtil { public static boolean compareJsonText(String str1, String str2) { return com ...
java TestNG测试报告美化
测试报告执行完测试用例之后,会在项目的test-output(默认目录)下生成测试报告打开index.html文件,测试结果摘要,包括:套件名.测试用例成功数.测试用例失败数.测试用例忽略数和te ...
java——数组队列 ArrayQueue
队列: Array: package Date_pacage; public class Array<E> { //叫它静态数组 //private int[] data; private ...
Hive 变量和属性
Hive 中变量和属性命名空间下面我们来用几个例子操作下: &hive SLF4J: Class path contains multiple SLF4J bindings.SLF4J: F ...
python安装包的时候报错
python安装包的时候报错今天兴致勃勃的安装了一个paramiko包,过程很顺利,但是到结尾的时候报错,这就让人不爽了. 所以呢,需要安装一个名为python-dev的软件包. 该软件包包括头文件 ...
关于let 和 var 的作用域问题
直接来一个经典案例: // 1. 下面的结果是什么? 为什么? for (var i=0;i<5;i++){ setTimeout(function () { console.log(i) }, ...
Linux环境常用命令
bash host #查看IP对应机器名 hostname #查看本机名 hostname –i #查看本机IP mssh ...
使用PIE对IE6、7、8进行CSS3兼容介绍和经验总结
下面说说如何对 IE10 以下版本的浏览器进行部分 CSS3 兼容国外团队开发的兼容插件,去年做项目时才发现,非常强大主角:PIE.js , PIE.htc 两种方法可以实现官方网站:h ...
IntelliJ IDEA里找不到javax.servlet的jar包
此处有小坑,请注意: https://mvnrepository.com网站查询到的servlet的包的格式为: provided group: 'javax.servlet', name: 'jav ...

Top K问题-BFPRT算法、Parition算法

基于Partition算法

Top K问题-BFPRT算法、Parition算法的更多相关文章

随机推荐

热门专题