（转）基于快速排序的TOPK算法

基于快速排序的TOPK算法

转自：http://blog.csdn.net/fanzitao/article/details/7617223

思想：

类似于快速排序，首先选择一个划分元，如果这个划分元的序号index刚好等于k，那么这个划分元以及左边的数，刚好组成了top-k small data;如果index>k, 那top-k small data在index的左边，那么就继续递归从index-1和数中选取top-k.如果index < k,那么说明还要从index的右边，选取top-(k-index) small data.

代码如下：

public class TopK_Quick {

    public static int Partition(int a[],int low,int high)

    {

        a[0]=a[low];

        int pivokey = a[low];

        while(low<high)

        {

            while(low<high && a[high]>=pivokey) --high;

            a[low] = a[high];

            while(low<high && a[low]<=pivokey) ++low;

            a[high]= a[low];

        }

        a[low]=a[0];

        return low;

    }

    public static void display(int a[],int k)

    {

        for(int i=1;i<=k;i++)

        {

            System.out.print(a[i]+" ");

        }

    }

    public static int selectK(int a[],int start,int end,int k)

    {

        int index = 0;

        if(start<end)

        {

            index = Partition(a,start,end);

            if(index == k)//正好找到第k大的数

            {

                index = k;

            }else if(index < k)//还要从index的右边找k-index个数

            {

                index = selectK(a,index+1,end,k-index);

            }else if(index > k)//k个数都在Index的左边

            {

                index = selectK(a,start,index-1,k);

            }

        }

        return index;

    }

    public static void main(String args[])

    {

        int k=0;

        int a[]={0,49,38,29,65,97,76,13,27,49,22,19};

        if(k>0&&k<=a.length-1)

        {

            selectK(a,1,a.length-1,k);

            display(a,k);

        }else{

            System.out.println("Are You Kidding Me?");

        }

    }

}

学习之处：

二分查找subroutine还可以用于寻找Top K问题。
别人代码里面二分查找实现是非递归的！

（转）基于快速排序的TOPK算法的更多相关文章

最小生成树--Prim算法，基于优先队列的Prim算法，Kruskal算法，Boruvka算法，“等价类”UnionFind
最小支撑树树--Prim算法,基于优先队列的Prim算法,Kruskal算法,Boruvka算法,“等价类”UnionFind 最小支撑树树前几节中介绍的算法都是针对无权图的,本节将介绍带权图的最小 ...
分治思想--快速排序解决TopK问题
----前言最近一直研究算法,上个星期刷leetcode遇到从两个数组中找TopK问题,因此写下此篇,在一个数组中如何利用快速排序解决TopK问题. 先理清一个逻辑解决TopK问题→快速排序→递 ...
关于堆排序和topK算法的PHP实现
问题描述 topK算法,简而言之,就是求n个数据里的前m大个数据,一般而言,m<<n,也就是说,n可能有几千万,而m只是10或者20这样的两位数. 思路最简单的思路,当然是使用要先对这n ...
JavaScript基于时间的动画算法
转自:https://segmentfault.com/a/1190000002416071 前言前段时间无聊或有聊地做了几个移动端的HTML5游戏.放在不同的移动端平台上进行测试后有了诡异的发现, ...
mahout入门指南之基于mahout的itembased算法
基于mahout的itembased算法事实上mahout分布式上仅仅是实现了部分算法.比方推荐算法中Item-based和slopone都有hadoop实现和单机版实现,User-based没有分 ...
基于ReliefF和K-means算法的医学应用实例
基于ReliefF和K-means算法的医学应用实例数据挖掘方法的提出,让人们有能力最终认识数据的真正价值,即蕴藏在数据中的信息和知识.数据挖掘 (DataMiriing),指的是从大型数据库或数据 ...
大数据算法->推荐系统常用算法之基于内容的推荐系统算法
港真,自己一直非常希望做算法工程师,所以自己现在开始对现在常用的大数据算法进行不断地学习,今天了解到的算法,就是我们生活中无处不在的推荐系统算法. 其实,向别人推荐商品是一个很常见的现象,比如我用了一 ...
基于FPGA的Cordic算法实现
CORDIC(Coordinate Rotation Digital Computer)算法即坐标旋转数字计算方法,是J.D.Volder1于1959年首次提出,主要用于三角函数.双曲线.指数.对数的 ...
基于Twitter的Snowflake算法实现分布式高效有序ID生产黑科技（无懈可击）
参考美团文档:https://tech.meituan.com/2017/04/21/mt-leaf.html Twitter-Snowflake算法产生的背景相当简单,为了满足Twitter每秒上万 ...

随机推荐

C++学习书籍评价
1.C++程序设计-现代方法本书非常适合学习了C语言基础,想跨步到C++学习的同学,前20章都是C基础的回顾,简直不要太简单,后面的课后习题花了半个小时做完了,没怎么出错,嗯,我的C语言基础还是可以 ...
经常使用的cmd命令
ASSOC 显示或修改文件扩展名关联.ATTRIB 显示或更改文件属性.BREAK 设置或清除扩展式 CTRL+C 检查.BCDEDIT 设置启动数据库中的属性以控制启动加载.CACLS 显示或修改文 ...
js -- 操作sqlite数据库
最近看到一个使用js来操作sqlite数据库的,测试了一下,具体使用的是 js操作类: https://github.com/kripken/sql.js/(sqlite js 驱动) 异步请求:ht ...
第四十七篇入门机器学习——分类的准确性（Accuracy）
No.1. 通常情况下,直接将训练得到的模型应用于真实环境中,可能会存在很多问题 No.2. 比较好的解决方法是,将原始数据中的大部分用于训练数据,而留出少部分数据用于测试,即,将数据集切分成训练数据 ...
如何查看当前工程，已经安装的nuget包？
本文链接:https://blog.csdn.net/Microsoft_Mao/article/details/101161872如果想知道,当前解决方案(solution)里都安装了什么包,这里可 ...
C++-POJ1988-Cube Stacking[数据结构][并查集]
int find(int x){return fa[x]==x?x:fa[x]=find(fa[x]);} #include <set> #include <map> #inc ...
sql根据字符将一行拆成多行
SELECT B.value FROM ( SELECT [value] = CONVERT(xml,'<root><v>' + REPLACE('A,C,D', ',', ' ...
Python | 字符串拆分和拼接及常用操作
一.字符串拆分 str = "hola ha1 ha2 china ha3 " # partition 从左侧找到第一个目标,切割成三组数据的[元组] str1 = str.par ...
NOIP2012 疫情控制题解（LuoguP1084）
NOIP2012 疫情控制题解(LuoguP1084) 不难发现,如果一个点向上移动一定能控制更多的点,所以可以二分时间,判断是否可行. 但根节点不能不能控制,存在以当前时间可以走到根节点的点,可使 ...
【正确使用vim编辑器的姿势】
"vi:可视化接口(Visual Interface) vim:是vi的增强版(vi iMprove) vi编辑器是所有Unix及Linux系统下标准的编辑器,他就相当于windows系统中 ...

（转）基于快速排序的TOPK算法

（转）基于快速排序的TOPK算法的更多相关文章

随机推荐

热门专题