2017/8/13 12:51:30 一.算法解决的问题 统计频繁项:统计一个数据流中出现频率最高的 k 的元素. 例如 问:k=3,统计数据流 [1,2,1,4,2,5,6,4] 中的频繁项. 答:[1,2,4]. 这看起来是一个简单的问题.但当数据流的规模较大,且实时性要求较高时,问题便麻烦了起来.主要有两方面的问题 算法必须在内存受限的情况下工作,即空间复杂度较低: 算法的执行速度必须很快,即时间复杂度较低. 当然,为了解决上述的问题,需要对结果的准确率做些牺牲.Misra-Gries 算…