知道BloomFilter是因为RocksDB数据库中用到了这个技术,用于判断1个数据是否存在于1个SST文件中. BloomFilter可能存在误判,就是判断数据是存在集合中,而实际上可能不存在,概率是很低的.但是判断不存在,则一定就是不存在集合中的. 资料查阅后,BloomFilter还可以用于网络爬虫,用于URL去重.垃圾邮件,关键字检查,es的percolator也可以完成关键字匹配和预警. 下面我们具体来看Bloom Filter是如何用位数组表示集合的.初始状态时,Bloom Fil…