【算法31】寻找数组的主元素(Majority Element)
给定一个数组A[n], 定义数组的主元素 ( Majority Element) 为数组中出现次数超过 n/2 的元素。设计一个高效的算法来寻找数组的主元素。题目来源在这里 。
最容易想到的方法就是便利数组进行元素计数,然后返回元素个数大于 n/2 的元素,这种方法需要 O(n) 的时间复杂度 和 O(n) 空间复杂度,不算是一个好方法。
在解法一的基础上考虑消去 O(n) 的空间复杂度,如果元素出现次数超过 n/2,那么假设数组已经排序的话,那么中位数就是我们要找的数。进一步的我们除了中位数,我们不需要其他的数排好序。问题进一步转化为求数组的中位数,推广版本就是在O(n)的时间内寻找第 i 大的数,这在算法导论上有详细的论述,网上资料也很多。基本来说,就是利用快排的 partition 对数组进行划分,分为 [..., pivot, ...] 三个部分,假设划分后 pivot 是第 m 个元素,如果 m == i, 则pivot 即为第 i 大元素;反之对如果 pivot 的位置在大于 i (m > i),则对 left 部分进行递归寻找第 i 大元素;反之对 right 部分进行递归寻找第 (i - m) 大元素。代码如下, 然而这种算法在大数组的情况下回超时。
#include <iostream>
#include <string>
#include <vector>
#include <set>
#include <unordered_set>
#include <map>
#include <unordered_map>
#include <queue>
#include <stack>
#include <algorithm>
#include <functional>
#include <utility>
#include <cstdio>
#include <cstdlib>
using namespace std; /*
* Return a position k, such that all the elements in [left, k)
* are smaller than or equal to num[k] && all the elements in
* (k, right] are larger than num[k]
* Note that here is the randomize version of partition, every time
* we choose a random number as the pivot.
int RandomPartition(vector<int> &num, int left, int right)
// random partition
int rnd = rand() % (right - left + ) + left;
swap(num[rnd], num[right]); // pivot
int x = num[right];
int i = left - ;
for (int j = left; j < right; ++j)
if (num[j] <= x)
swap(num[j], num[i + ]);
i += ;
swap(num[right], num[i+]);
return i + ;
} /*
* Return the i-th ordered element in num[left, right] but without
* sorting the array.
*/ int RandomSelect(vector<int> &num, int left, int right, int i)
if (right - left + < i || left > right) return -; // partition the num[], return the pivot position m
int m = RandomPartition(num, left, right); // k is the number of element in num[left, m]
int k = m - left + ; if (k == i)
return num[m];
else if (k > i)
// find the i-th ordered element in num[left, m-1]
return RandomSelect(num, left, m - , i);
// find the (i-k)-th ordered element in num[m+1, right]
return RandomSelect(num, m + , right, i - k);
} /*
* return the median of num[]
int majorityElement(vector<int> &num)
int n = num.size();
int mid = n / ;
return RandomSelect(num, , n-, mid);
} int main()
int a[] = {, , };
int b[] = {, , , }; vector<int> v1(a, a + );
vector<int> v2(b, b + ); cout << majorityElement(v1) << endl;
cout << majorityElement(v2) << endl; return ;
这种方法的思想是把 majority element 看成是 1,而把其他的元素看成是 -1。算法首先取第一个元素 x 作为 majority element,并计 mark = 1;而后遍历所有的元素,如果元素和 x 相等, 则 mark ++;否则如果不等, 则 mark--, 如果 mark == 0, 则重置 mark = 1, 并且更新 x 为当前元素。 由于majority element 的数量大于一半,所以最后剩下的必然是majority element. AC code 如下.
#include <iostream>
#include <string>
#include <vector>
#include <set>
#include <unordered_set>
#include <map>
#include <unordered_map>
#include <queue>
#include <stack>
#include <algorithm>
#include <functional>
#include <utility>
#include <cstdio>
#include <cstdlib>
using namespace std; int majorityElement(vector<int>& num)
int n = num.size();
if (n < ) return -;
if (n == ) return num[]; int x = num[];
int mark = ;
for (int i = ; i < n; ++i)
if (mark == )
mark = ;
x = num[i];
else if (num[i] == x)
else if (num[i] != x)
return x;
} int main()
int a[] = {, , };
int b[] = {, , , }; vector<int> v1(a, a + );
vector<int> v2(b, b + ); cout << majorityElement(v1) << endl;
cout << majorityElement(v2) << endl; return ;
[1] 《算法导论》第二版,第九章 《中位数和顺序统计学》.
[2] http://people.cis.ksu.edu/~subbu/Papers/Majority%20Element.pdf
