首页 ¦ 归档 > 标签: 爬虫,布隆去重

基于Redis的Bloomfilter去重(附Python代码)

“去重”是日常工作中会经常用到的一项技能,在爬虫领域更是常用,并且规模一般都比较大。去重需要考虑两个点:去重的数据量、去重速度。为了保持较快的去重速度,一般选择在内存中进行去重。

© PyCN技术评论. Built using Pelican. Theme by Giulio Fidente on github.