Redis字典实现、Hash键冲突及渐进式rehash详解

2025-02-18 06:07:41

Redis字典实现

哈希表节点结构

typedef struct dictEntry
{
	// 键
	void *key;

	// 值 : 可以是一个指针，或者是一个uint64/int64 的整数
	union {
		void *val;
		uint64_t u64;
		int64_t s64
	} v;

	// 指向下一个哈希表节点，形成链表 ： 该指针可以将多个哈希值相同的键值对连接在一起，以此解决键冲突的问题。
	struct dictEntry *next;
} dictEntry;

哈希表结构

typedef struct dictht
{
	// 哈希表数据
	dictEntry **table;

	// 哈希表集合大小
	unsigned long size;

	// 哈希表大小掩码，用于计算索引值
	// 总是等于 size - 1
	unsigned long sizemask;

	// 哈希表已有节点数量
	unsigned long used;
} dictht;

字典

typedef struct dict
{
	// 类型特定函数
	dicType *type;

	// 私有数据
	void *privdata;

	// 哈希表
	dictht ht[2];

	// rehash 索引
	// 当rehash不在进行时， 值为-1
	int rehashidx;
} dict;

type属性和privdata属性针对不同类型的键值对，为多态字典而设置。
ht是包含两个项的数组，每个元素都是一个dictht哈希表，一般情况下字典之是哟个ht[0],ht[1]会在对ht[0]进行rehash的时候使用。
rehashidx记录了rehash目前的进度，如果目前没有在进行rehash，值为-1。

哈希算法

使用字典设置的哈希函数，计算key的hashvalue

hash = dict->type->hashFunction(key);

使用哈希表的sizemask属性和哈希值，计算出索引值
根据不同的情况，ht[x]可以是ht[0]或ht[1]

index = hash & dict->ht[x].sizemask;

redis使用的是MurmurHash算法，优点是：输入的键是有规律的时候，算法仍然能给出很好的随机分布性，计算速度也快。

解决hash冲突

当有两个或以上的key分配到了hash table数组的同一个index上，称为发生了collision。
Redis采用链地址法解决冲突，每个hash table节点都有一个next指针，多个hash table节点可以用next指针构成一个单向链表。为了速度考虑，程序总是会将新节点插入到链表头位置。

rehash

随着操作不断执行，哈希表保存的key value对会逐渐增加和减少。哈希表有一个统计参数load factor，即负载因子，公式如下：

# 负载因子 = 哈希表已经保存的节点数量 / 哈希表大小
load_factor = ht[0].used / ht[0].size;

为了维持负载因子在一个合理的范围，程序会对哈希表的大小进行相应的扩展或收缩，条件如下：

1、服务器目前没有执行BGSAVE命令或者BGREWRITEAOF命令，并且哈希表的负载因子 >= 1

2、服务器正在执行BGSAVE命令或者BGREWRITEAOF命令，且负载因子 >= 5

在执行BGSAVE命令或者BGREWRITEAOF命令过程中，Redis需要创建当前服务器进程的子进程，大多的OS采用写时复制技术优化子进程的使用效率，所以子进程存在期间，**服务器会提高执行扩展操作的负载因子，避免在子进程存在期间进行哈希表的扩展操作，避免不必要的内存写入操作，最大限度节约内存。**当负载因子小于0.1时，程序自动对哈希表进行收缩操作。
此时就会进行扩展收缩，规则如下：
这里就是rehash(重新散列)操作了：
1、为字典的ht[1]哈希表分配内存空间，空间大小取决于要执行的操作，以及ht[0]当前包含的键值对数量（ht[0].used）
如果是扩展操作，ht[1]的大小为 >= ht[0].used * 2的 2的幂次方
如果是收缩操作，ht[1]的大小为 >= ht[0].used 的 2的幂次方
2、将保存在ht[0]中的所有键值对rehash到ht[1]上：即重新计算key的hashValue以及indexValue，然后将键值对放到ht[1]的指定位置
3、当ht[0]包含的所有键值对都迁移到ht[1]之后，ht[0]变为空表，释放ht[0]，将ht[1]置为ht[0]，在ht[1]重新分配一个空白的哈希表，为下一次rehash做准备

渐进式hash

rehash的动作并不是一次性集中完成的，而是分多次渐进完成。
如果哈希表中村的键值对数量很多，一次性将键值对全部rehash到ht[1]的计算量十分庞大，可能会导致服务器在一段时间内停止服务。
渐进式rehash采取分而治之的方法，将rehash键值对所需要的计算工作分摊到每次对字典的CRUD操作上，从而避免了集中式rehash带来的庞大计算量。
详细步骤如下：
1、为ht[1]分配空间，让字典同时持有ht[0]和ht[1]两个哈希表
2、在字典中维护一个索引计数器：rehashidx，将值设置为0，表示rehash工作正式开始。
3、在rehash进行期间，每次对字典的CRUD操作，程序除了执行指定操作以外，顺带将ht[0]哈希表在rehashidx索引上的所有键值对rehash到ht[1]上，当rehash操作完成后，程序将rehashidx值++
4、重复迭代操作执行后，ht[0]的数据全部rehash到ht[1]上，将rehashidx设为-1，表明rehash操作已经完成

需要注意的地方
在rehash的过程中，对于字典的删除、查找、更新操作会在两个哈希表上执行。如想要查找一个键，现在ht[0]中找，没有找到再去ht[1]
对于insert操作来说，新添加到字典的键值对会一律保存到ht[1]中，不然还得多一次搬运。

到此这篇关于Redis字典实现、Hash键冲突以及渐进式rehash的文章就介绍到这了,更多相关Redis 渐进式rehash内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

Redis教程(四)：Hashes数据类型

一.概述: 我们可以将Redis中的Hashes类型看成具有String Key和String Value的map容器.所以该类型非常适合于存储值对象的信息.如Username.Password和Age等.如果Hash中包含很少的字段,那么该类型的数据也将仅占用很少的磁盘空间.每一个Hash可以存储4294967295个键值对. 二.相关命令列表: 命令原型时间复杂度命令描述返回值 HSET key field value O(1) 为指定的Key设定Field/Value对,如果Key不
SpringBoot+Redis实现数据字典的方法

前言我们在日常的开发过程中针对一些字段采用整型的方式去代替某些具体的含义,比如性别0代表男,1代表女.如果只是一些不会变更的转译我们可以采用常量或者枚举类的方式来实现,但是事实上我们也会遇到那种可能需要变更的,显然这种场景下使用枚举类这种方式是不合理的,那么如何动态地去进行转译呢? 正文数据字典数据字典(Data dictionary)是一种用户可以访问的记录数据库和应用程序元数据的目录.主动数据字典是指在对数据库或应用程序结构进行修改时,其内容可以由DBMS自动更新的数据字典.被动数据字
Python操作redis实例小结【String、Hash、List、Set等】

本文实例总结了Python操作redis方法.分享给大家供大家参考,具体如下: 这里介绍详细使用 1.String 操作 redis中的String在在内存中按照一个name对应一个value来存储 set() #在Redis中设置值,默认不存在则创建,存在则修改 r.set('name', 'zhangsan') '''参数: set(name, value, ex=None, px=None, nx=False, xx=False) ex,过期时间(秒) px,过期时间(毫秒) nx,如果设
redis中hash表内容删除的方法代码

hash: Redis hash是一个string类型的field和value的映射表,hash特别适合用于存储对象. Redis 中每个hash可以存储 232 - 1键值对(40多亿). 实例: 127.0.0.1:6379> HMSET runoobkey name "redis tutorial" description "redis basic commands for caching" likes 20 visitors 23000 OK 127.
Redis String 类型和 Hash 类型学习笔记与总结

Linux 版本信息: 复制代码代码如下: cat /etc/issue 或cat /etc/redhat-release(Linux查看版本当前操作系统发行版信息) CentOS release 6.6 (Final) (一)String 类型 [定义]string 是最简单的类型,你可以理解成与 Memcached 是一模一样的类型,一个 key 对应一个 value,其上支持的操作与 Memcached 的操作类似.但它的功能更丰富. string 类型是二进制安全的.意思是 redi
redis中Hash字典操作的方法

目录 1.Redis操作之Hash操作 redis hash字典操作 1.Redis操作之Hash操作 redis支持五大数据类型,只支持第一层,也就说字典的value值,必须是字符串如果value值想存字典,必须用json转换一下,转成字符串 redis hash字典操作 reids:{ k1:'dafdadfasf', m1:{ 'key2':value2, 'key1':value1, } } 1.hset(name, key, value),插入值 # name对应的hash中设置一个
python redis存入字典序列化存储教程

在python中通过redis hset存储字典时,必须主动把字典通过json.dumps()序列化为字符串后再存储, 不然hget获取后将无法通过json.loads()反序列化为字典序列化存储 r = redis_conn() r.hset('wait_task', 'one', json.dumps({'project': 'india', 'total_size': '15.8 MB'})) r.hset('wait_task', 'two', json.dumps({'project
Redis字典实现、Hash键冲突及渐进式rehash详解

目录 Redis字典实现哈希表节点结构哈希表结构字典哈希算法解决hash冲突 rehash 渐进式hash 本笔记参考<Redis设计与实现> P24~ 37 Redis字典实现哈希表节点结构 typedef struct dictEntry { // 键 void *key; // 值 : 可以是一个指针,或者是一个uint64/int64 的整数 union { void *val; uint64_t u64; int64_t s64 } v; // 指向下一个哈希表节点,形成
python字典多键值及重复键值的使用方法(详解)

在Python中使用字典,格式如下: dict={ key1:value1 , key2;value2 ...} 在实际访问字典值时的使用格式如下: dict[key] 多键值字典的多键值形式如下: dict={(ke11,key12):value ,(key21,key22):value ...} 在实际访问字典里的值时的具体形式如下所示(以第一个键为例): dict[key11,key12] 或者是: dict[(key11,key12)] 以下是实际例子: 多值在一个键值对应多个值时,
Redis中键和数据库通用指令详解

目录一.Redis键(key)通用指令 1.key基本操作 2.时效性控制 3.查询模式 4.其它操作二.数据库通用指令 1.基本操作 2.相关操作一.Redis键(key)通用指令可以参考菜鸟教程:Redis 键命令用于管理 redis 的键 key特征:key是一个字符串,通过key获取redis中保存的数据. 1.key基本操作命令功能 del key 该命令用于在 key 存在时删除 key exists key 检查给定 key 是否存在 type key 返回 key 所
iOS小技能之字典转模及对象相等性示例详解

目录前言 I 字典转模型 1.1 字典转模型的实现步骤 1.2 字典转模型的过程 II 对象的相等性 & 本体性 2.1 相等性检查 2.2 Foundation 框架中,自己实现的相等性检查 2.3 字符串驻留 III 代码重构(前提是已经实现了基本功能) see also 前言字典转模型 /** 通常实现字典实例化模型,都实现了以下模型的实例化方法*/ //使用字典实例化模型 - (instancetype) initWithDictionary :(NSDictionary *) ap
js单页hash路由原理与应用实战详解

本文主要介绍了js单页hash路由原理与应用实战详解,分享给大家,具体如下: 什么是路由? 通俗点说,就是不同的URL显示不同的内容什么是单页应用? 单页,英文缩写为SPA( Single Page Application),就是把各种功能做在一个页面内. 那所谓的单页路由应用就是:在一个页面内,通过切换地址栏的URL来实现切换内容的变化. 如何知道URL切换了呢? 当url后面的锚文本发生变化时, 会触发onhashchange事件.通过这个事件,我们就可以对不同的URL 做出不同的处理.锚
django自定义非主键自增字段类型详解(auto increment field)

1.django自定义字段类型,实现非主键字段的自增 # -*- encoding: utf-8 -*- from django.db.models.fields import Field, IntegerField from django.core import checks, exceptions from django.utils.translation import ugettext_lazy as _ class AutoIncreField(Field): description =
MySQL 外键(FOREIGN KEY)用法案例详解

引子:把所有数据都存放于一张表的弊端表的组织结构复杂不清晰浪费空间扩展性极差为了解决上述的问题,就需要用多张表来存放数据. 表与表的记录之间存在着三种关系:一对多.多对多.一对一的关系. 处理表之间关系问题就会利用到FOREIGN KEY 多对一关系: 寻找表与表之间的关系的套路举例:雇员表:emp表部门:dep表 part1: 先站在表emp的角度去找表emp的多条记录能否对应表dep的一条记录. 翻译2的意义: 左表emp的多条记录==>多个员工右表dep的一条记录==>
MySQL外键约束(Foreign Key)案例详解

目录一.MySQL外键约束作用二.外键约束创建 (一)创建外键约束的条件 (二)在创建数据表时创建外键约束 (三)在创建数据表后添加外键约束三.外键约束功能演示总结今天继续给大家介绍MySQL相关知识,本文主要内容是MySQL外键约束详解. 一.MySQL外键约束作用外键约束(Foreign Key)即数据库中两个数据表之间的某个列建立的一种联系.这种联系通常是以实际场景中含义完全相同的字段所造成的.MySQL通过外键约束的引入,可以使得数据表中的数据完整性更强,也更符合显示情况.下
JavaScript策略模式利用对象键值的映射关系详解

目录引言 1.策略模式的极简实现 2.策略模式的简单案例 (1)工具函数 (2)提示样式总结引言策略模式指的是,定义一系列的算法,把它们一个个的封装起来,通过传递一些参数,使他们可以相互替换. 举个周末从家去咖啡馆的例子: 从家去咖啡馆,有跑步.骑行和漫步的方式.也就是说,从家到咖啡馆,有三种策略可选择. 1.策略模式的极简实现通过对象的键值映射关系,定义策略和具体实现之间的关系: var strategies = { A: xxx, B: yyy, C: zzz } 其中,A.B和C
Redis中键值过期操作示例详解

1.过期设置 Redis 中设置过期时间主要通过以下四种方式: expire key seconds:设置 key 在 n 秒后过期: pexpire key milliseconds:设置 key 在 n 毫秒后过期: expireat key timestamp:设置 key 在某个时间戳(精确到秒)之后过期: pexpireat key millisecondsTimestamp:设置 key 在某个时间戳(精确到毫秒)之后过期: 下面分别来看以上这些命令的具体实现. 1)expire:N

Redis字典实现、Hash键冲突及渐进式rehash详解

目录