http://blog.csdn.net/pipisorry/article/details/49742907 海量数据挖掘Mining Massive Datasets(MMDs) -Jure Leskovec courses学习笔记 相似项的发现:面向高相似度的方法 {博客内容:More about Locality-Sensitive Hashing:当所能接受的相似度较低时,基于LSH的方法表现得更为有效.但当要找几乎相等的集合时,还存在一些更快的方法,并且这些方法是精准的,即它们会找到…