浅析Redis 切片集群的数据倾斜问题

2026-07-03 17:01:49

Redis 中如何应对数据倾斜

什么是数据倾斜

如果 Redis 中的部署，采用的是切片集群，数据是会按照一定的规则分散到不同的实例中保存，比如，使用 Redis Cluster 或 Codis。

数据倾斜会有下面两种情况：

1、数据量倾斜：在某些情况下，实例上的数据分布不均衡，某个实例上的数据特别多。

2、数据访问倾斜：虽然每个集群实例上的数据量相差不大，但是某个实例上的数据是热点数据，被访问得非常频繁。

发生了数据倾斜，会造成那些数据量大的和访问高的实例节点，系统的负载升高，响应速度变慢。严重的情况造成内存资源耗尽，引起系统崩溃。

数据量倾斜

数据量倾斜，也就是实例上的数据分布不均衡，某个实例中的数据分布的特别多。

数据量的倾斜，主要有下面三种情况：

1、bigkey导致倾斜；

2、Slot分配不均衡导致倾斜；

3、Hash Tag导致倾斜。

下面来一一的分析下

bigkey导致倾斜

什么是 bigkey：我们将含有较大数据或含有大量成员、列表数的 Key 称之为大Key。

一个 STRING 类型的 Key，它的值为 5MB（数据过大）

一个 LIST 类型的 Key，它的列表数量为 20000 个（列表数量过多）

一个 ZSET 类型的 Key，它的成员数量为 10000 个（成员数量过多）

一个 HASH 格式的 Key，它的成员数量虽然只有 1000 个但这些成员的 value 总大小为 100MB（成员体积过大）

如果某个实例中保存了 bigkey，那么就有可能导致集群的数据倾斜。

bigkey 存在问题

内存空间不均匀：如果采用切片集群的部署方案，容易造成某些实例节点的内存分配不均匀；

造成网络拥塞：读取 bigkey 意味着需要消耗更多的网络流量，可能会对 Redis 服务器造成影响；

过期删除：bigkey 不单读写慢，删除也慢，删除过期 bigkey 也比较耗时；

迁移困难：由于数据庞大，备份和还原也容易造成阻塞，操作失败；

如何避免

对于bigkey可以从以下两个方面进行处理

1、合理优化数据结构

1、对较大的数据进行压缩处理；

2、拆分集合：将大的集合拆分成小集合（如以时间进行分片）或者单个的数据。

2、选择其他的技术来存储 bigkey；

使用其他的存储形式，考虑使用 cdn 或者文档性数据库 MongoDB。

Slot分配不均衡导致倾斜

例如在 Redis Cluster 通过 Slot 来给数据分配实例

1、Redis Cluster方案采用哈希槽来处理 KEY 在不同实例中的分布，一个切片集群共有 16384 个哈希槽，这些哈希槽类似于数据分区，每个键值对都会根据它的 key，被映射到一个哈希槽中；

2、一个 KEY ，首先会根据 CRC16 算法计算一个16 bit的值；然后，再用这个 16bit 值对 16384 取模，得到 0~16383 范围内的模数，每个模数代表一个相应编号的哈希槽。

3、然后把哈希槽分配到所有的实例中，例如，如果集群中有N个实例，那么，每个实例上的槽个数为16384/N个。

如果 Slot 分配的不均衡，就会导致某几个实例中数据量偏大，进而导致数据倾斜的发生。

出现这种问题，我们就可以使用迁移命令把这些 Slot 迁移到其它实例上，即可。

Hash Tag导致倾斜

Hash Tag 用于 redis 集群中，其作用是将具有某一固定特征的数据存储到同一台实例上。其实现方式为在 key 中加个 {}，例如 test{1}。

使用 Hash Tag 后客户端在计算 key 的 crc16 时，只计算 {} 中数据。如果没使用 Hash Tag，客户端会对整个 key 进行 crc16 计算。

数据key	哈希计算	对应的Slot
user:info:{3231}	CRC16('3231') mod 16384	1024
user:info:{5328}	CRC16('5328') mod 16384	3210
user:order:{3231}	CRC16('3231') mod 16384	1024
user:order:{5328}	CRC16('5328') mod 16384	3210

这样通过 Hash Tag 就可以将某一固定特征数据存储到一台实例上，避免逐个查询集群中实例。

栗如：如果我们进行事务操作或者数据的范围查询，因为Redis Cluster和 Codis 本身并不支持跨实例的事务操作和范围查询，当业务应用有这些需求时，就只能先把这些数据读取到业务层进行事务处理，或者是逐个查询每个实例，得到范围查询的结果。

Hash Tag潜在的问题就是，可能存在大量数据被映射到同一个实例的情况出现，导致集群的数据倾斜，集群中的负载不均衡。

所有当我使用 Hash Tag 的时候就做好评估，我们的业务诉求如果不使用 Hash Tag 可以解决吗，如果不可避免的使用，我们需要评估好数据量，尽量避免数据倾斜的出现。

数据访问倾斜

虽然每个集群实例上的数据量相差不大，但是某个实例上的数据是热点数据，被访问得非常频繁，这就是数据访问倾斜。

数据量访问倾斜的罪魁祸首就是 Hot Key

切片集群中的 Key 最终会存储到集群中的一个固定的 Redis 实例中。某一个 Key 在一段时间内访问远高于其它的 Key,也就是该 Key 对应的 Redis 实例,会收到过大的流量请求，该实例容易出现过载和卡顿现象，甚至还会被打挂掉。

常见引发热点 Key 的情况：

1、新闻中的热点事件；

2、秒杀活动中的，性价比高的商品；

如何发现 Hot Key1、提现预判；

根据业务经验进行提前预判；

2、在客户端进行收集；

通过在客户端增加命令的采集，来统计发现热点 Key;

3、使用 Redis 自带的命令排查；

使用monitor命令统计热点key（不推荐，高并发条件下会有造成redis 内存爆掉的隐患）；

hotkeys参数，redis 4.0.3提供了redis-cli的热点key发现功能，执行redis-cli时加上–hotkeys选项即可。但是该参数在执行的时候，如果key比较多，执行起来比较慢。

4、在Proxy层做收集

如果集群架构引入了 proxy，可以在 proxy 中做统计

5、自己抓包评估

Redis客户端使用TCP协议与服务端进行交互，通信协议采用的是RESP。自己写程序监听端口，按照RESP协议规则解析数据，进行分析。缺点就是开发成本高，维护困难，有丢包可能性。

Hot Key 如何解决

知道了Hot Key如何来应对呢

1、对 Key 进行分散处理；

举个栗子

有一个热 Key 名字为Hot-key-test,可以将其分散为Hot-key-test1，Hot-key-test2...然后将这些 Key 分散到多个实例节点中，当客户端进行访问的时候，随机一个下标的 Key 进行访问，这样就能将流量分散到不同的实例中了，避免了一个缓存节点的过载。

一般来讲，可以通过添加后缀或者前缀，把一个 hotkey 的数量变成 redis 实例个数 N 的倍数 M，从而由访问一个redis key变成访问N * M个redis key。 N*M个redis key经过分片分布到不同的实例上，将访问量均摊到所有实例。

const M = N * 2
//生成随机数
random = GenRandom(0, M)
//构造备份新key
bakHotKey = hotKey + “_” + random
data = redis.GET(bakHotKey)
if data == NULL {
    data = GetFromDB()
    redis.SET(bakHotKey, expireTime + GenRandom(0,5))
}

2、使用本地缓存;

业务端还可以使用本地缓存，将这些热 key 记录在本地缓存，来减少对远程缓存的冲击。

这里，有个地方需要注意下，热点数据多副本方法只能针对只读的热点数据。如果热点数据是有读有写的话，就不适合采用多副本方法了，因为要保证多副本间的数据一致性，会带来额外的开销。

对于有读有写的热点数据，我们就要给实例本身增加资源了，例如使用配置更高的机器，来应对大量的访问压力。

总结

1、数据倾斜会有下面两种情况；

1、数据量倾斜：在某些情况下，实例上的数据分布不均衡，某个实例上的数据特别多。

2、数据访问倾斜：虽然每个集群实例上的数据量相差不大，但是某个实例上的数据是热点数据，被访问得非常频繁。

2、数据量的倾斜，主要有下面三种情况；

1、bigkey导致倾斜；

2、Slot分配不均衡导致倾斜；

3、Hash Tag导致倾斜。

3、数据访问倾斜，原因就是 Hot Key 造成的，出现Hot Key，一般下面有下面两种方式去解决；

1、对 Key 进行分散处理；

2、使用本地缓存;

参考

【Redis核心技术与实战】https://time.geekbang.org/column/intro/100056701
【Redis设计与实现】https://book.douban.com/subject/25900156/
【Redis 的学习笔记】https://github.com/boilingfrog/Go-POINT/tree/master/redis
【Redis中的切片集群】https://boilingfrog.github.io/2022/02/20/redis中常见的集群部署方案/#切片集群
【Redis 切片集群的数据倾斜分析】https://boilingfrog.github.io/2022/06/22/Redis切片集群的数据倾斜分析/

到此这篇关于Redis 切片集群的数据倾斜分析的文章就介绍到这了,更多相关Redis数据倾斜内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

Windows下搭建Redis集群的方法步骤

目录 Redis集群: 在Windows系统下搭建Redis集群: 1.下载并安装Redis 2.下载并安装ruby 3.创建Redis集群 Redis集群: 如果部署到多台电脑,就跟普通的集群一样:因为Redis是单线程处理的,多核CPU也只能使用一个核, 所以部署在同一台电脑上,通过运行多个Redis实例组成集群,然后能提高CPU的利用率. 在Windows系统下搭建Redis集群: 需要4个部件: Redis.Ruby语言运行环境.Redis的Ruby驱动redis-xxxx.gem.创建
Redis Cluster集群收缩主从节点详细教程

目录 1.Cluster集群收缩概念 2.将6390主节点从集群中收缩 2.1.计算需要分给每一个节点的槽位数 2.2.分配1365个槽位给192.168.81.210的6380节点 2.3.分配1365个槽位给192.168.81.220的6380节点 2.4.分配1365个槽位给192.168.81.230的6380节点 2.5.查看当前集群槽位分配 3.验证数据迁移过程是否导致数据异常 4.将下线的主节点从集群中删除 4.1.删除节点 4.2.调整主从交叉复制 4.3.当节点存在数据无法删
redis集群实现清理前缀相同的key

目录 redis集群清理前缀相同的key 原来的定期清理脚本的逻辑 redis集群(jedis)批量删除同一前缀 redis集群清理前缀相同的key 最近经常收到redis集群告警,每天收到50多封邮件,实在不胜其烦,内存不够用,原因是有一些无用的key(约3000万)占用内存(具体不说了).这部分内存不能被释放. 原来的定期清理脚本的逻辑打开一个redis链接,在内部循环从1000万到7亿之间的数据,然后加上前缀去批量删除,这种方式属于广撒网式的清理,穷举法,不但耗时,效果也不好. 因为有的
redis集群搭建过程(非常详细,适合新手)

目录 redis集群搭建一.Redis Cluster(Redis集群)简介二.集群搭建需要的环境三.集群搭建具体步骤如下(注意要关闭防火墙) 四.结语 redis集群搭建在开始redis集群搭建之前,我们先简单回顾一下redis单机版的搭建过程下载redis压缩包,然后解压压缩文件: 进入到解压缩后的redis文件目录(此时可以看到Makefile文件),编译redis源文件: 把编译好的redis源文件安装到/usr/local/redis目录下,如果/local目录下没有redi
浅析Redis 切片集群的数据倾斜问题

目录 Redis 中如何应对数据倾斜什么是数据倾斜数据量倾斜 bigkey导致倾斜 Slot分配不均衡导致倾斜 Hash Tag导致倾斜数据访问倾斜总结参考 Redis 中如何应对数据倾斜什么是数据倾斜如果 Redis 中的部署,采用的是切片集群,数据是会按照一定的规则分散到不同的实例中保存,比如,使用 Redis Cluster 或 Codis. 数据倾斜会有下面两种情况: 1.数据量倾斜:在某些情况下,实例上的数据分布不均衡,某个实例上的数据特别多. 2.数据访问倾斜:虽然每个
Redis Cluster集群数据分片机制原理

Redis Cluster数据分片机制 Redis 集群简介 Redis Cluster 是 Redis 的分布式解决方案,在 3.0 版本正式推出,有效地解决了 Redis 分布式方面的需求. Redis Cluster 一般由多个节点组成,节点数量至少为 6 个才能保证组成完整高可用的集群,其中三个为主节点,三个为从节点.三个主节点会分配槽,处理客户端的命令请求,而从节点可用在主节点故障后,顶替主节点. 如上图所示,该集群中包含 6 个 Redis 节点,3主3从,分别为M1,M2,M3,S
玩转Redis搭建集群之Sentinel详解

前言 Redis作为内存数据库,需要具备高可用的特点,不然如果服务器宕机,还在内存里的数据就会丢失.我们最常用的高可用方法就是搭建集群,master机器挂了,可以让slave机器顶上,继续提供服务.但是Redis集群是不会自动进行主从切换的,也就是说,如果主节点非常不争气的在凌晨3点挂了,那么运维同学就要马上起床,把从节点改成主节点,这样的操作是非常繁琐低效的.为此,Redis官方提供了一种解决方案:Redis Sentinel 简介 Redis Sentinel集群通常由3到5个节点组成,如果
Redis 哨兵集群的实现

目录 1.Sentinel 哨兵 2.Redis 主从分离一.配置Master 二.配置Slave 1.在配置文件中配置从服务 2.在服务启动后设置 3.总结 3.Sentinel 哨兵 1.配置端口 2.配置主服务器的ip 和端口 3.启动Sentinel 4.关闭Master 5.重连Master 4.Sentinel 总结一.Sentinel的作用: 二.Sentinel的工作方式: 1.Sentinel 哨兵 Sentinel(哨兵)是Redis 的高可用性解决方案:由一个或多个Se
k8s部署redis cluster集群的实现

Redis 介绍 Redis代表REmote DIctionary Server是一种开源的内存中数据存储,通常用作数据库,缓存或消息代理.它可以存储和操作高级数据类型,例如列表,地图,集合和排序集合. 由于Redis接受多种格式的密钥,因此可以在服务器上执行操作,从而减少了客户端的工作量. 它仅将磁盘用于持久性,而将数据完全保存在内存中. Redis是一种流行的数据存储解决方案,并被GitHub,Pinterest,Snapchat,Twitter,StackOverflow,Flickr等技
Redis Cluster集群动态扩容的实现

目录一.引言二.Cluster集群增加操作 1.动态增加Master主服务器节点 2.动态增加Slave从服务器节点三.Cluster集群删除操作 1.动态删除Slave从服务器节点 2.动态删除Master主服务器节点四.总结一.引言上一篇文章我们一步一步的教大家搭建了Redis的Cluster集群环境,形成了3个主节点和3个从节点的Cluster的环境.当然,大家可以使用 Cluster info 命令查看Cluster集群的状态,也可以使用Cluster Nodes 命令来详细
Redis Cluster 集群搭建你会吗

三台机器 201.202.203,每台机器装两个 redis 实例,构建 redis cluster 集群. 1. 安装添加 redis-cluster 目录,将 redis 压缩包拷贝到该目录下,解压压缩包. 解压完后,将文件夹 redis-5.0.3 重命名为 redis1. [root@test201 redis-cluster]# mv redis-5.0.3 redis1 需要在 redis1 目录下使用 make 命令进行编译. [root@test201 redis-cluste
深入浅析RabbitMQ镜像集群原理

目录集群架构 1)首先一个基本的 RabbitMQ 集群不是高可用的 2)其次 RabbitMQ 集群本身并没有提供负载均衡的功能 3)接着假设我们只采用一台 HAProxy 4)最后,任何想要连接到 RabbitMQ 集群的客户端搭建集群准备: 1.准备3个虚拟机 2.设置node1.node2.node3的hosts 安装Erlang: 安装RabbitMQ: 同步cookie: 集群搭建: 集群架构 RabbitMQ 集群是一个或多个节点的逻辑分组,集群中的每个节点都是对等的每个节点
分布式Redis Cluster集群搭建与Redis基本用法

目录 Redis集群搭建 Redis是啥集群(Cluster) RedisCluster说明 RedisCluster节点 RedisCluster集群模式不能保证一致性创建和使用Redis集群部署三个主节点非docker docker安装创建集群 Redis入门 Redis中的数据类型字符串(string) 哈希(Hash) 列表(Lists) 集合(Set) 有序集合(sortedset) Redis 集群搭建 Redis 是啥 Redis(全称 REmote DIctiona