Redis 布隆过滤器命令的使用详解

2025-12-27 10:26:46

一、Docker 安装 Redis 布隆过滤器

Redis 本身并不支持布隆过滤器，而是采用插件的方式去安装的，以达到一种热拔插的效果。

因为我对于 liunx 来说就是一个小白，所以还是用 docker 香。

我就开始搜索如何为 docker 上的 Redis 安装布隆过滤器，实现方式我看了看有好几种~，但是大都数都需要去下载 redis 布隆过滤器的那个模块，我觉得这样也太麻烦了，肯定有前人偷过懒了，果然有更直接的方式~

学习历史重要原因之一，就是要学会感恩，因为我们都是站在巨人的肩膀上。

Docker 上有个redislabs/rebloom的镜像，它是将redis和布隆过滤器打包在一起的一个镜像，直接使用这个镜像启动的redis容器，直接就可以使用布隆过滤器~:woman:‍:computer:

1.1、安装

搜索镜像

docker search redislabs/rebloom

拉取镜像

docker pull redislabs/rebloom

启动镜像

docker run -d -p 6379:6379 --name myrebloom redislabs/rebloom

注意：

我只是为了有个写demo的环境，所以redis未落盘，也未设置密码，用的也是默认端口，真实要用，不能这么玩，当然也没这样玩的。

1.2、测试

进入容器中，我们来用redis-cli玩一玩~

docker exec -it [容器名|容器id] bash #/bin/bash 都可
 redis-cli

确定没啥问题，咱们来玩 Redis 的布隆过滤器

二、RedisBloom 命令讲解

2.1、命令大纲

先看看总共有哪些命令，待会咱们一条一条来尝试，均来自redis官网。

Command	Description
BF.ADD	添加一个元素到布隆过滤器
BF.EXISTS	判断元素是否在布隆过滤器
BF.INFO	返回有关布隆过滤器的信息
BF.INSERT	将多个元素添加到过滤器。如果键不存在，它会创建一个新的过滤器。
BF.MADD	添加多个元素到布隆过滤器
BF.MEXISTS	判断多个元素是否在布隆过滤器
BF.RESERVE	创建一个布隆过滤器。设置误判率和容量
BF.SCANDUMP	开始增量保存 Bloom 过滤器。
BF.LOADCHUNK	恢复之前使用BF.SCANDUMP保存的布隆过滤器。

2.2、BF.ADD 和 BF.MADD

语法格式：

BF.ADD key value
 BF.MADD key value1 value2 ...

当key不存在的时候，会创建一个空的布隆过滤器，并会给定一个默认的误判率和含有上限容量的的子过滤器。并且通过这种方式创建出来的布隆过滤器，是能够自动缩放的。

每一次扩容，新的子过滤器是用前一个子过滤器的大小来进行扩张，默认扩张倍数为2.

BF.ADD类似于集合的sadd命令，不过bf.add一次只能添加一个元素到集合中。一次性添加多个则使用bf.madd.

2.3、BF.EXISTS 和 BF.MEXISTS

上面也已经用到了，它就是用来判断元素是否在布隆过滤器中

语法：

bf.exists key value
 bf.mexists key value1 value2 ...

存在返回1，不存在返回0

2.4、BF.INFO

返回有关布隆过滤器的信息,

语法格式：

bf.info key

Capacity #  子过滤器的上限
 (integer) 100
 Size #布隆过滤器的容量大小
 (integer) 296
 Number of filters  #当前过滤器数量 这里应该是记录子过滤器数量吧
 (integer) 1
 Number of items inserted # 插入的值的数量
 (integer) 1
 Expansion rate #默认的扩张倍数
 (integer) 2

一个数据看不出来，多插入两条，看一下对比，大家就明白了

2.5、BF.RESERVE

语法格式：

bf.reserve key error_rate capacity [EXPANSION expansion] [NONSCALING]

使用bf.reserve命令创建一个自定义的布隆过滤器。bf.reserve命令有三个参数，分别是：

key
error_rate
capacity

然后还有两个可选参数：EXPANSION和NONSCALING

1、EXPANSION：简单说它就是扩张倍数，省略则默认为2。

如果要存储在过滤器中的元素数量未知，我们建议您使用expansion2 或更多来减少子过滤器的数量。否则，我们建议您使用expansion1 来减少内存消耗。默认扩展值为 2。

2、NONSCALING：如果写了这个参数，在达到初始容量，为防止过滤器创建额外的子过滤器。过滤器在达到容量时会返回错误capacity，当让非缩放过滤器比缩放过滤器需要的内存略少。

示例：

bf.reserve nzc:redisboom1 0.01 100
 bf.reserve nzc:redisboom2 0.01 100  EXPANSION 1
 bf.reserve nzc:redisboom3 0.01 100  NONSCALING

我把相关的信息都打印出来了，大家从所输出的信息中也能够看出它们的一些区别。

小结：

如果是预估不到数据的范围量，而且没有办法计算的增长量，那么我觉得暂定为默认的即可。
如果是能够估算数据的大致范围，数据增长速度有迹可循，那么可以适当的推算一下EXPANSION这个参数该设置的大小。
如果数据范围没有那么那么大，并且可以接受较大程度的误判率，那么EXPANSION设置为1会更好，能够节省内存消耗。
NONSCALING如果使用此参数，则是将数组大小固定了，需要考虑清楚是否适合。
布隆过滤器的error_rate越小，需要的存储空间就越大，对于不需要过于精确的场景，error_rate设置稍大一点也可以。布隆过滤器的capacity设置的过大，会浪费存储空间，设置的过小，就会影响准确率，所以在使用之前一定要尽可能地精确估计好元素数量，还需要加上一定的冗余空间以避免实际元素可能会意外高出设置值很多。总之，error_rate和capacity都需要设置一个合适的数值。

2.6、BF.INSERT

语法格式

BF.INSERT key [CAPACITY capacity] [ERROR error]
   [EXPANSION expansion] [NOCREATE] [NONSCALING] ITEMS item [item...]

由中括号包裹的都是可选参数。大都数参数上面都说到了

NOCREATE指示如果过滤器不存在，则不应创建它。如果过滤器尚不存在，则返回错误而不是自动创建它。这可以用于过滤器创建和过滤器添加之间需要严格分离的地方。

示例：

BF.INSERT nzc:redisboom4  items key1 key2 key3

补充：

BF.SCANDUMP # 开始布隆过滤器的增量保存。这对于无法适应法线DUMP和RESTORE模型的大型布隆过滤器很有用。
 BF.LOADCHUNK  #恢复以前使用保存的过滤器SCANDUMP。

到此这篇关于Redis布隆过滤器的相关命令的使用的文章就介绍到这了,更多相关Redis布隆过滤器内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

浅析python实现布隆过滤器及Redis中的缓存穿透原理

目录布隆过滤器的原理在 Python 中使用布隆过滤器 1.标准布隆过滤器. 2.计数布隆过滤器. 3.标准扩容布隆过滤器. 4.计数扩容布隆过滤器. Redis 中使用布隆过滤器最后的话在开发软件时,我们经常需要判断一个元素是否在一个集合中,比如,如何判断单词的拼写是否错误(判断单词是否在已知的字典中):在网络爬虫里,如何确认一个网址是否已经爬取过:反垃圾邮件系统中,如何判断一个邮件地址是否为垃圾邮件地址等等. 如果这些作为面试题那就很有区分度了,初级工程师就会说,把全部的元素都存在
Redis中Redisson布隆过滤器的学习

目录简介使用 Demo 依赖测试代码简析初始化添加元素检索元素简介本文基于Spring Boot 2.6.6.redisson 3.16.0简单分析Redisson布隆过滤器的使用. 布隆过滤器是一个非常长的二进制向量和一系列随机哈希函数的组合,可用于检索一个元素是否存在: 使用场景如下: 解决Redis缓存穿透问题: 邮件过滤: 使用建立一个二进制向量,所有位设置0: 选择K个散列函数,用于对元素进行K次散列,计算向量的位下标: 添加元素:将K个散列函数作用于该元素,生成K
Redis使用元素删除的布隆过滤器来解决缓存穿透问题

目录前言缓存雪崩解决方案缓存击穿解决方案缓存穿透解决方案布隆过滤器(Bloom Filter) 什么是布隆过滤器位图(Bitmap) 哈希碰撞布隆过滤器的2大特点 fpp 布隆过滤器的实现(Guava) 布隆过滤器的如何删除带有计数器的布隆过滤器总结前言在我们日常开发中,Redis使用场景最多的就是作为缓存和分布式锁等功能来使用,而其用作缓存最大的目的就是为了降低数据库访问.但是假如我们某些数据并不存在于Redis当中,那么请求还是会直接到达数据库,而一旦在同一时间大
布隆过滤器(bloom filter)及php和redis实现布隆过滤器的方法

引言在介绍布隆过滤器之前我们首先引入几个场景. 场景一在一个高并发的计数系统中,如果一个key没有计数,此时我们应该返回0,但是访问的key不存在,相当于每次访问缓存都不起作用了.那么如何避免频繁访问数量为0的key而导致的缓存被击穿? 有人说, 将这个key的值置为0存入缓存不就行了吗?确实,这是一个好的方案.大部分情况我们都是这样做的,当访问一个不存在的key的时候,设置一个带有过期时间的标志,然后放入缓存.不过这样做的缺点也很明显,浪费内存和无法抵御随机key攻击. 场景二在一个黑名
SpringBoot+Redis实现布隆过滤器的示例代码

目录简述 Redis安装BloomFilter 基本指令结合SpingBoot 方式一方式二简述关于布隆过滤器的详细介绍,我在这里就不再赘述一遍了我们首先知道:BloomFilter使用长度为m bit的字节数组,使用k个hash函数,增加一个元素: 通过k次hash将元素映射到字节数组中k个位置中,并设置对应位置的字节为1.查询元素是否存在: 将元素k次hash得到k个位置,如果对应k个位置的bit是1则认为存在,反之则认为不存在. Guava 中已经有具体的实现,而在我们实际生产
SpringBoot+Redis布隆过滤器防恶意流量击穿缓存

目录什么是恶意流量穿透怎么防布隆过滤器的另一个用武场景给Redis安装BloomFilter 在Redis里使用BloomFilter 结合SpringBoot使用搭建springboot工程使用压测工具喂120万条数据进入RedisBloomfilter看实际效果本文主要介绍了SpringBoot+Redis布隆过滤器防恶意流量击穿缓存,具体如下: 什么是恶意流量穿透假设我们的Redis里存有一组用户的注册email,以email作为Key存在,同时它对应着DB里的User表的
Redis实现布隆过滤器的方法及原理

布隆过滤器(Bloom Filter)是1970年由布隆提出的.它实际上是一个很长的二进制向量和一系列随机映射函数.布隆过滤器可以用于检索一个元素是否在一个集合中.它的优点是空间效率和查询时间都比一般的算法要好的多,缺点是有一定的误识别率和删除困难. 本文将介绍布隆过滤器的原理以及Redis如何实现布隆过滤器. 应用场景 1.50亿个电话号码,现有10万个电话号码,如何判断这10万个是否已经存在在50亿个之中?(可能方案:数据库,set, hyperloglog) 2.新闻客户端看新闻时,它会不
Redis 布隆过滤器命令的使用详解

目录一.Docker 安装 Redis 布隆过滤器学习历史重要原因之一,就是要学会感恩,因为我们都是站在巨人的肩膀上. 1.1.安装注意: 1.2.测试二.RedisBloom 命令讲解 2.1.命令大纲 2.2.BF.ADD 和 BF.MADD 2.3.BF.EXISTS 和 BF.MEXISTS 2.4.BF.INFO 2.5.BF.RESERVE 2.6.BF.INSERT 因为平常使用 Docker 比较多,所以照常还是使用Docker来准备环境啦. 一.Docker 安装 Re
victoriaMetrics库布隆过滤器初始化及使用详解

目录 victoriaMetrics库布隆过滤器概述限速器的初始化总结 victoriaMetrics库布隆过滤器代码路径:/lib/bloomfilter 概述 victoriaMetrics的vmstorage组件会接收上游传递过来的指标,在现实场景中,指标或瞬时指标的数量级可能会非常恐怖,如果不限制缓存的大小,有可能会由于cache miss而导致出现过高的slow insert. 为此,vmstorage提供了两个参数:maxHourlySeries和maxDailySeries
C++ BloomFilter布隆过滤器应用及概念详解

目录一.布隆过滤器概念二.布隆过滤器应用三.布隆过滤器实现 1.插入 2.查找 3.删除四.布隆过滤器优缺五.结语一.布隆过滤器概念布隆过滤器是由布隆(Burton Howard Bloom)在1970年提出的一种紧凑型的.比较巧妙的概率型数据结构,特点是高效地插入和查询,可以用来告诉你 “某样东西一定不存在或者可能存在”,它是用多个哈希函数,将一个数据映射到位图结构中.此种方式不仅可以提升查询效率,也可以节省大量的内存空间 . 位图的优点是节省空间,快,缺点是要求范围相对集中,
PHP操作Redis常用命令的实例详解

redis常用命令有: 1.连接操作命令: 2.持久化命令: 3.远程服务控制命令: 4.对value操作命令:5.string命令: 6.list命令: 7.set命令: 8.hash命令等等. Redis 常用命令登录 redis-cli -p 5566 -a password 检查key是否存在 EXISTS key 搜索某关键字 KSYS *4 返回一个Key所影响的vsl的类型 TYPE key 下面通过代码看下PHP操作Redis命令,代码如下所示: //连接本地的 Redis 服
Redis 实现队列原理的实例详解

Redis 实现队列原理的实例详解场景说明: ·用于处理比较耗时的请求,例如批量发送邮件,如果直接在网页触发执行发送,程序会出现超时 ·高并发场景,当某个时刻请求瞬间增加时,可以把请求写入到队列,后台在去处理这些请求 ·抢购场景,先入先出的模式命令: rpush + blpop 或 lpush + brpop rpush : 往列表右侧推入数据 blpop : 客户端阻塞直到队列有值输出简单队列: simple.php $stmt = $pdo->prepare('select id, c
ubuntu 16.04安装redis的两种方式教程详解(apt和编译方式）

ubuntu 16.04安装redis的两种方式教程如下所示: 方式一 :apt安装在 Ubuntu 系统安装 Redi 可以使用以下命令: $sudo apt-get update $sudo apt-get install redis-server 启动 Redis $ redis-server 查看 redis 是否启动? $ redis-cli 以上命令将打开以下终端: redis 127.0.0.1:6379> 127.0.0.1 是本机 IP ,6379 是 redis 服务端口.
redis中的数据结构和编码详解

redis中的数据结构和编码: 背景: 1>redis在内部使用redisObject结构体来定义存储的值对象. 2>每种类型都有至少两种内部编码,Redis会根据当前值的类型和长度来决定使用哪种编码实现. 3>编码类型转换在Redis写入数据时自动完成,这个转换过程是不可逆的,转换规则只能从小内存编码向大内存编码转换. 源码: 值对象redisObject: typedef struct redisObject { unsigned ty
docker安装redis并以配置文件方式启动详解

更新最近发现服务器被挖矿病毒入侵了很有可能是因为redis没有设置密码的原因! 1.获取redis镜像 docker pull redis 指定版本号: docker pull redis:4.0.9 不加版本号默认获取最新版本,也可以使用 docker search redis 查看镜像来源 2.查看本地镜像 docker images 3.然后启动容器,做映射 ①创建配置文件目录存放redis.conf,文件从官网下载. ②创建文件夹,新建配置文件贴入从官网下载的配置文件并修改 mkdi
Redis数据过期策略的实现详解

目录一.设置过期时间 1.常用方式 2.字符串独有方式二.3种过期策略三.Redis采用的过期策略四.RDB对过期key的处理五.AOF对过期key的处理本文对Redis的过期机制简单的讲解一下讲解之前我们先抛出一个问题,我们知道很多时候服务器经常会用到redis作为缓存,有很多数据都是临时缓存一下,可能用过之后很久都不会再用到了(比如暂存session,又或者只存放日行情股票数据)那么就会出现一下几个问题了 Redis会自己回收清理不用的数据吗?如果能,那如何配置?如果不能,如何