TopK问题,数组中第K大(小)个元素问题总结
问题描述:
在未排序的数组中找到第 k 个最大的元素。请注意,你需要找的是数组排序后的第 k 个最大的元素,而不是第 k 个不同的元素。
面试中常考的问题之一,同时这道题由于解法众多,也是考察时间复杂度计算的一个不错的问题。
1,选择排序
利用选择排序,将数组中最大的元素放置在数组的最前端,然后第k次选择的最大元素就是第K大个元素,直接根据索引返回结果即可。
public class Select {
public static void main(String[] args) {
int[] arr = new int[]{5,3,2,1,4,7,8,10,6,9};
System.out.println(findKthLargest(arr, 3));
}
private static int findKthLargest(int[] arr, int k){
if(k <= 0 || k > arr.length)
throw new IllegalArgumentException("k error");
for(int i = 0; i < k; ++i){
int maxNum = Integer.MIN_VALUE;
int maxIndex = -1;
for(int j = i; j < arr.length; ++j){
if(arr[j] > maxNum){
maxNum = arr[j];
maxIndex = j;
}
}
swap(arr, maxIndex, i);
}
System.out.println(Arrays.toString(arr));
return arr[k-1];
}
private static void swap(int[] arr, int i, int j){
int temp = arr[i];
arr[i] = arr[j];
arr[j] = temp;
}
}
结果:
[10, 9, 8, 1, 4, 7, 2, 5, 6, 3]
8
我们可以看到数组经过选择排序后,前三个元素分别是三趟选择中最大的元素,直接返回k-1索引位置的元素,即是第K大的元素。
时间复杂度O(n*K),经过K次选择,每次选择都要遍历n个元素。
2,排序优化
上一个方法的本质实际上是将整个数组进行一个排序,然后根据索引位置得到答案,基于这个情况我们可以使用一些更快速的排序方法,例如选择排序或归并排序,以达到平局时间复杂度为O(nlogn)
public class Sort {
public static void main(String[] args) {
int[] arr = new int[]{5,3,2,1,4,7,8,10,6,9};
System.out.println(findKthLargest(arr, 2));
}
private static int findKthLargest(int[] arr, int k){
if(k <= 0 || k > arr.length)
throw new IllegalArgumentException("k error");
Arrays.sort(arr);
System.out.println(Arrays.toString(arr));
return arr[arr.length-k];
}
}
结果:
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
9
时间复杂度O(nlogn),最坏时间复杂度根据不同的排序方法而不一样,快排的话就是O(n^2),归并排序是O(nlogn)。
3,堆(优先队列)
思路是创建一个最小堆,将所有数组中的元素加入堆中,并保持堆的大小小于等于 k
。这样,堆中就保留了前 k
个最大的元素。这样,堆顶的元素就是正确答案。
public class Heap {
public static void main(String[] args) {
int[] arr = new int[]{5,3,2,1,4,7,8,10,6,9};
System.out.println(findKthLargest(arr, 3));
}
private static int findKthLargest(int[] arr, int k){
if(k <= 0 || k > arr.length)
throw new IllegalArgumentException("k error");
PriorityQueue<Integer> queue = new PriorityQueue<>((a,b)->{
return a-b;
});
for(int num:arr){
queue.offer(num);
if(queue.size() > k)
queue.poll();
}
return queue.peek();
}
}
时间复杂度是O(nlogk),向大小为 k 的堆中添加或删除元素的时间复杂度为O(logk),遍历n个元素,故总时间复杂度为 O(nlogk)
4,快速选择
基于快排的思想,选出一个基准元素,将数组划分成两部分,左侧的元素都比基准元素大,右侧的都比基准元素小,如果基准元素的索引恰好等于k-1,也就是说这个基准元素就是第k大的元素,否则根据基准元素的位置再去左边或者右边去选择。
import java.util.PriorityQueue;
import java.util.Random; public class QuickSelect {
public static void main(String[] args) {
int[] arr = new int[]{5,3,2,1,4,7,8,10,6,9};
System.out.println(findKthLargest(arr, 10));
}
private static int findKthLargest(int[] arr, int k){
if(k <= 0 || k > arr.length)
throw new IllegalArgumentException("k error");
return quickSelect(arr, 0, arr.length-1, k);
}
private static int quickSelect(int[] arr, int left, int right, int k){
if(left == right)
return arr[left];
Random random_num = new Random();
int pivotIndex = left + random_num.nextInt(right - left);
pivotIndex = partition(arr, left, right, pivotIndex);
if(pivotIndex == k-1){
return arr[pivotIndex];
}else if(pivotIndex < k-1){
return quickSelect(arr, pivotIndex+1, right, k);
}else{
return quickSelect(arr, left, pivotIndex-1, k);
}
}
private static int partition(int[] arr, int left, int right, int pivotIndex){
int pivot = arr[pivotIndex];
swap(arr, pivotIndex, right);
int l = left, r = right;
while(l < r){
while(l < r && arr[l] >= pivot)
l++;
if(arr[l] < pivot)
swap(arr, l, r);
while(l < r && arr[r] <= pivot)
r--;
if(arr[r] > pivot)
swap(arr, l, r);
}
return l;
}
private static void swap(int[] arr, int i, int j){
int temp = arr[i];
arr[i] = arr[j];
arr[j] = temp;
}
}
这里我们选择一个数组中的随机值作为基准值,如果每次恰好都划分一半的元素的话,则T(n) = n + n/2 + n/4 + n/8 + n/16 + ... = 2n,也就是O(n)的时间复杂度。
但如果每一次选择的元素恰好是最小值的话,时间复杂度则退化到了O(n^2)
但是平均时间复杂度是O(n),算法导论上有严格的证明。
5,BFPRT
在BFPRT算法中,仅仅是改变了快速排序Partion中的pivot值的选取,在快速排序中,我们始终选择第一个元素或者最后一个元素作为pivot,而在BFPTR算法中,每次选择五分中位数的中位数作为pivot,这样做的目的就是使得划分比较合理,从而避免最坏情况的发生。算法步骤如下:
- 将输入数组的n个元素划分为n/5组,每组5个元素,且至多只有一个组由剩下的n%5个元素组成。
- 寻找n/5个组中每一个组的中位数,首先对每组的元素进行插入排序,然后从排序过的序列中选出中位数。
- 对于2中找出的n/5个中位数,递归进行步骤1和2,直到只剩下一个数即为这n/5个元素的中位数,找到中位数后并找到对应的下标p。
- 进行Partion划分过程,Partion划分中的pivot元素下标为p。
- 进行高低区判断即可
本算法的最坏时间复杂度为O(n),值得注意的是通过BFPTR算法将数组按第K小(大)的元素划分为两部分,而这高低两部分不一定是有序的,通常我们也不需要求出顺序,而只需要求出前K大的或者前K小的。
public class BFPRT {
public static void main(String[] args) {
int[] arr = new int[]{3,2,3,1,2,4,5,5,6};
System.out.println(findKthLargest(arr, 4));
}
private static int findKthLargest(int[] arr, int k){
if(k <= 0 || k > arr.length)
throw new IllegalArgumentException("k error");
return quickSelect(arr, 0, arr.length-1, k);
}
private static int findMedian(int[] arr, int l, int r){
int i = l, index = 0;
for(; i + 4 <= r; i += 5, index++){
sort(arr, i, i + 4);
swap(arr, l + index, i + 2);
}
if(i <= r){
sort(arr, i, r);
swap(arr, l+index, i + (r-i+1) / 2); //如果是最后数组元素是偶数选择较小的一个
index++;
}
if(index == 1)
return l;
else
return findMedian(arr, l, l+index-1);
}
private static int quickSelect(int[] arr, int left, int right, int k){
if(left == right)
return arr[left];
// Random random = new Random();
// int pivotIndex = left + random.nextInt(right - left);
int pivotIndex = findMedian(arr, left, right);
pivotIndex = partition(arr, left, right, pivotIndex);
if(pivotIndex == k-1){
return arr[pivotIndex];
}else if(pivotIndex < k-1){
return quickSelect(arr, pivotIndex+1, right, k);
}else{
return quickSelect(arr, left, pivotIndex-1, k);
}
}
private static int partition(int[] arr, int left, int right, int pivotIndex){
int pivot = arr[pivotIndex];
swap(arr, pivotIndex, right);
int l = left, r = right;
while(l < r){
while(l < r && arr[l] >= pivot)
l++;
if(arr[l] < pivot)
swap(arr, l, r);
while(l < r && arr[r] <= pivot)
r--;
if(arr[r] > pivot)
swap(arr, l, r);
}
return l;
}
private static void swap(int[] arr, int i, int j){
int temp = arr[i];
arr[i] = arr[j];
arr[j] = temp;
}
public static void sort(int[] arr, int l, int r){
for(int i = l; i <= r; i++){
for(int j = i+1; j <= r; j++){
if(arr[j] < arr[i])
swap(arr, i, j);
}
}
}
}
TopK问题,数组中第K大(小)个元素问题总结的更多相关文章
- 一题多解(五) —— topK(数组中第 k 大/小的数)
根据对称性,第 k 大和第 k 小,在实现上,是一致的,我们就以第 k 小为例,进行说明: 法 1 直接排序(sort(A, A+N)),当使用一般时间复杂度的排序算法时,其时间复杂度为 O(N2) ...
- [LeetCode] Kth Largest Element in an Array 数组中第k大的数字
Find the kth largest element in an unsorted array. Note that it is the kth largest element in the so ...
- [经典算法题]寻找数组中第K大的数的方法总结
[经典算法题]寻找数组中第K大的数的方法总结 责任编辑:admin 日期:2012-11-26 字体:[大 中 小] 打印复制链接我要评论 今天看算法分析是,看到一个这样的问题,就是在一堆数据 ...
- [LeetCode] 215. Kth Largest Element in an Array 数组中第k大的数字
Find the kth largest element in an unsorted array. Note that it is the kth largest element in the so ...
- 前端算法题:找出数组中第k大的数字出现多少次
题目:给定一个一维数组,如[1,2,4,4,3,5],找出数组中第k大的数字出现多少次. 例如:第2大的数是4,出现2次,最后输出 4,2 function getNum(arr, k){ // 数组 ...
- 查找数组中第k大的数
问题: 查找出一给定数组中第k大的数.例如[3,2,7,1,8,9,6,5,4],第1大的数是9,第2大的数是8-- 思考:1. 直接从大到小排序,排好序后,第k大的数就是arr[k-1]. 2. ...
- 寻找数组中第K大的数
给定一个数组A,要求找到数组A中第K大的数字.对于这个问题,解决方案有不少,此处我只给出三种: 方法1: 对数组A进行排序,然后遍历一遍就可以找到第K大的数字.该方法的时间复杂度为O(N*logN) ...
- 无序数组中第K大的数
1. 排序法 时间复杂度 O(nlogn) 2. 使用一个大小为K的数组arr保存前K个最大的元素 遍历原数组,遇到大于arr最小值的元素时候,使用插入排序方法,插入这个元素 时间复杂度,遍历是 O( ...
- 【转载】【树状数组区间第K大/小】
原帖:http://www.cnblogs.com/zgmf_x20a/archive/2008/11/15/1334109.html 回顾树状数组的定义,注意到有如下两条性质: 一,c[ans]=s ...
随机推荐
- linux高级应用第九章-正则表达式
笔记部分 基础正则表达式: ^ 第1个符号 ,以什么什么开头 ^m $ 第2个符号,以什么什么结尾 m$ ,还表示空行,或空格,可以用cat -An 试一下 ^$ 第3个符号,空行 ...
- 【Java8新特性】面试官:谈谈Java8中的Stream API有哪些终止操作?
写在前面 如果你出去面试,面试官问了你关于Java8 Stream API的一些问题,比如:Java8中创建Stream流有哪几种方式?(可以参见:<[Java8新特性]面试官问我:Java8中 ...
- 【QT】QT资料集锦
欢迎来到我的博客! 以下链接均是日常学习,偶然得之,并加以收集整理,感兴趣的朋友可以多多访问和学习.如果以下内容对你有所帮助,不妨转载和分享.(Update on 30,November,2019) ...
- [JavaWeb基础] 014.Struts2 标签库学习
在Struts1和Struts2中都有很多很方便使用的标签库,使用它可以让我们的页面代码更加的简洁,易懂,规范.标签的形式就跟html的标签形式一样.上面的篇章中我们也讲解了自定义标签那么在如何使用标 ...
- POJ 2671 Jimmy's Bad Day题解(很详细很友好,类似区间dp)
有问题的话欢迎在评论区提出 题意: 题目链接 你是一个送快递的,现在给你一个环,环的边有权值,代表走这条边所花的时间,每个点代表一个地点,点有点权,代表这个点上有多少货物需要你送.初始时间\(t=0\ ...
- 【项目】关于TeenCode第二代评测机的技术分析
晚上睡不着觉,仔细研读了洛谷的第四代评测机技术分析后,突然发现自己写的TeenCode评测机竟然有这么多地方可以改进,这不得不让我诞生了实现第二代TeenCode评测机的想法.[第一代评测机挺可怜的, ...
- Chisel3 - model - IO ports
https://mp.weixin.qq.com/s/fgCvIFt0RdEajhJVSy125w 介绍模块的输入输出端口的定义与管理. 1. _ports 1) 模块的输入输出端口, ...
- Java实现 蓝桥杯 算法训练 字串统计
算法训练 字串统计 时间限制:1.0s 内存限制:512.0MB 问题描述 给定一个长度为n的字符串S,还有一个数字L,统计长度大于等于L的出现次数最多的子串(不同的出现可以相交),如果有多个,输出最 ...
- Java实现 LeetCode 466 统计重复个数
466. 统计重复个数 定义由 n 个连接的字符串 s 组成字符串 S,即 S = [s,n].例如,["abc", 3]="abcabcabc". 另一方面, ...
- java实现 蓝桥杯 算法训练 安慰奶牛
问题描述 Farmer John变得非常懒,他不想再继续维护供奶牛之间供通行的道路.道路被用来连接N个牧场,牧场被连续地编号为1到N.每一个牧场都是一个奶牛的家.FJ计划除去P条道路中尽可能多的道路, ...