`
xpenxpen
  • 浏览: 704251 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

布隆过滤器(Bloom Filter)

阅读更多
    布隆过滤器(Bloom Filter)是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive)。因此,Bloom Filter不适合那些“零错误”的应用场合。而在能容忍低错误率的应用场合下,Bloom Filter通过极少的错误换取了存储空间的极大节省.
    布隆过滤器里面的哈希算法很重要,必须是独立且均匀分布的,而且必须要快(密码杂凑比如SHA1不是一个好的选择)。
    介绍:http://billmill.org/bloomfilter-tutorial/
这个网址有动画演示。底部有一些实现的网址。
    guava也有一个实现,https://github.com/google/guava/wiki/HashingExplained#BloomFilter
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics