redis中的数据结构和编码详解

redis中的数据结构和编码:

    背景:

  • 1>redis在内部使用redisObject结构体来定义存储的值对象。
  • 2>每种类型都有至少两种内部编码,Redis会根据当前值的类型和长度来决定使用哪种编码实现。
  • 3>编码类型转换在Redis写入数据时自动完成,这个转换过程是不可逆的,转换规则只能从小内存编码向大内存编码转换。

    源码:

值对象redisObject:

typedef struct redisObject {
                unsigned type:4;                /* 对象类型 */
                unsigned encoding:4;            /* 内部编码 */
                unsigned lru:LRU_BITS;     /* lru time (relative to server.lruclock) */
                int refcount;                    /* 引用计数器,内存回收机制就是基于该值实现的 */
                void *ptr;                        /* 若要存储的是整数值则直接存储数据,否则表示指向数据的指针 */
            } robj;

        类型type:

说明:查看当前键的类型:type key

#define OBJ_STRING 0     /*字符串对象*/
            #define OBJ_LIST 1        /*列表对象*/
            #define OBJ_SET 2        /*集合对象*/
            #define OBJ_ZSET 3        /*有序集合对象*/
            #define OBJ_HASH 4        /*哈希对象*/

        编码encoding;

说明:查看当前键的编码:object encoding key

#define OBJ_ENCODING_RAW 0             /*Raw representation 简单动态字符串*/
            #define OBJ_ENCODING_INT 1             /*Encoded as integer long long类型整数*/
            #define OBJ_ENCODING_HT 2            /* Encoded as hash table 字典*/
            #define OBJ_ENCODING_ZIPMAP 3        /* Encoded as zipmap 压缩map*/
            #define OBJ_ENCODING_LINKEDLIST 4     /* Encoded as regular linked list 双端链表*/
            #define OBJ_ENCODING_ZIPLIST 5         /* Encoded as ziplist 压缩列表*/
            #define OBJ_ENCODING_INTSET 6         /* Encoded as intset 整数集合*/
            #define OBJ_ENCODING_SKIPLIST 7     /* Encoded as skiplist 跳跃表*/
            #define OBJ_ENCODING_EMBSTR 8         /* Embedded sds string encoding embstr编码的简单动态字符串*/
            #define OBJ_ENCODING_QUICKLIST 9     /* 基于压缩列表的双端列表实现的 快速表*/

        最后被访问的时间lru:

概念:记录对象最后一次被访问的时间。
            说明:
                1>查看当前键的空闲时间(该命令不会更新lru字段);object idletime key 。可以通过scan + object idletime key 来收集长时间未被访问的数据,然后手动清理。
                2>当配置了maxmemory和maxmemory-policy=volatile-lru或者allkeys-lru时,若内存超过了上限(maxmemory)后,则优先回收长时间没有被访问的数据,从而回收内存。

        引用计数器refcount:

概念:记录当前对象被引用的次数,当refcount=0时,可以安全回收当前对象空间。
            说明:获取当前对象引用:object refcount key

    类型对应的编码:

字符串:
            int:存放整形值的字符串。
            embstr:存放字符的短字符串(大小不超过44个字节)。
            raw:存放字符的长字符串(大小不超过44个字节)。
           
            embstr和raw的比较:
                raw调用2次内存分配函数,释放时当然也需要释放两次。
                embstr调用1次内存分配函数,分配一块连续的内存,释放时只需释放一次。

        列表(list):

压缩列表(ziplist):
                结构:所有数据都是采用线性连续的内存结构(大致可类比数组),目的是为了减少内存的占用,追求空间和时间的平衡。
                    1>以O(1)时间复杂度入队和出队。
                    2>读写操作涉及复杂的指针移动,最坏时间复杂度为O(n2),故列表的元素不易太多。
                    3>新增删除操作涉及内存重新分配,加大了操作的复杂性。

优点:占用内存较少,且占用的是一块连续的内存,故加载的速度相对更快一些。
                缺点:当元素的个数较大时,访问元素的时间较长。

应用:

适合存储小对象和长度有限(即使O(n2)的复杂度也不会太大)的数据。
                    当元素个数小于list-max-ziplist-entries(默认512) 且 所有元素值的大小都小于list-max-ziplist-value(默认64字节)时,使用ziplist作为列表的内部实现。

            双端链表(linkedlist):

优点:元素的个数较多时,访问元素的时间比压缩列表更快一些。
                缺点:因为是双向链表,故维护了前置指针、后置指针等结构,占用了更多的内存,且内存不是连续的,容易产生内存碎片。
                说明:当无法满足ziplist的条件时,使用linkedlist作为列表的内部实现。
                应用:当列表对象元素较多时,压缩列表就会转化为更适合存储大量元素的双端链表。
               
            注意:只能小内存编码向大内存编码转换。(若当元素增删频繁时,数据向压缩编码转换是非常消耗CPU的,得不偿失)

            快速列表(quicklist):

结构:一个双向链表,链表的每一个节点都是一个ziplist,故quicklist结合了双向链表和压缩列表的优点。
                Redis3.2开始,列表采用quicklist进行编码。

        哈希(hash):

压缩列表(ziplist):

应用:当元素个数小于hash-max-ziplist-entries(默认512) 且 所有元素value的大小都小于hash-max-ziplist-value(默认64字节)时,使用ziplist作为哈希的内部实现。

哈希表(hashtable):

优点:读写时间复杂度O(1)
                缺点:占用内存较多。
                应用:当无法满足ziplist的条件时,hashtable作为哈希的内部实现。

hash算法:与传统hash算法类似,根据key计算得到在哈希表中的位置,采用单链表解决冲突,达到加载因子时进行扩展,进而引发重哈希。

rehash:采用增量式重哈希:

概念:在扩容时不会一次性对所有的key进行rehash,而是将key的rehash操作分散延迟到其它操作(哈希表的查找、更新、删除)中。
                优点:避免由于大量的key在同一时间段进行rehash操作导致服务短暂无响应的问题。
                过程:在增量式的rehash过程中,会使用到两张哈希表:
                    查找:先从老表中查找,再从新表中查找,此外还会对一些key进行rehash操作。
                    新增:新增的键值对添加到新表中。

        集合(set):

整数集合(intset):
                结构:有序、不重复的整数集。
                    1>查找时间复杂度为O(logn)
                    2>插入时间复杂度为O(n)
                优点:占用的内存远小于hashtable,
                应用:当元素都是整数 且 元素个数小于set-max-intset-entries(默认512)时,使用intset作为集合的内部实现。

哈希表(hashtable):当无法满足intset的条件时,使用hashtable作为集合的内部实现。

        有序集合(zset):

说明:redis给有序集合中的每个元素设置一个分数(score)作为排序的依据。
           
            压缩列表(ziplist):
                应用:当元素个数小于zset-max-ziplist-entries(默认128个) 且 每个元素的值都小于zset-max-ziplist-value(默认64字节)时,使用ziplist作为有序集合的内部实现。
               
            跳跃表(skiplist):
                结构:跳跃表通过在每个节点中(基于层和跨度等)维持多个指向其它节点的指针来实现快速访问。
                    查找时间复杂度平均O(logn)、最坏O(n)。
                应用:当不满足ziplist条件时,使用skiplist作为内部实现。

    内存优化:

场景:有海量key和value都比较小的数据,在redis中如何存储才更省内存。
        原理:通过大幅减少key的数量来降低内存的消耗。
        实现:在客户端通过分组将海量的key根据一定的策略映射到一组hash对象中,由于value较小,故hash类型的对象会使用占用内存较小的ziplist编码。
            eg:如存在100万个键,可以映射到1000个hash中,每个hash保存1000个元素。

以上就是redis中的数据结构和编码详解的详细内容,更多关于redis中的数据结构和编码的资料请关注我们其它相关文章!

(0)

相关推荐

  • redis内部数据结构之SDS简单动态字符串详解

    前言 reids 没有直接使用C语言传统的字符串表示(以空字符结尾的字符数组)而是构建了一种名为简单动态字符串的抽象类型,并为redis的默认字符串表示,因为C字符串不能满足redis对字符串的安全性.效率以及功能方面的需求 1.SDS 定义 在C语言中,字符串是以'\0'字符结尾(NULL结束符)的字符数组来存储的,通常表达为字符指针的形式(char *).它不允许字节0出现在字符串中间,因此,它不能用来存储任意的二进制数据. sds的类型定义 typedef char *sds; 每个sds

  • 详解redis数据结构之压缩列表

     详解redis数据结构之压缩列表 redis使用压缩列表作为列表键和哈希键的底层实现之一.当一个列表键只包含少量的列表项,并且每个列表项都是由小整数值或者是短字符串组成,那么redis就会使用压缩列表存储列表项:同理,当一个哈希表包含的键值对都是由小整数值或者是短字符串组成,并且存储的键值对数目不多时,redis也会使用压缩列表来存储哈希表.以下是压缩列表存储结构: zlbytes长度为4个字节,记录了整个压缩列表所占用的字节数 zltail长度为4个字节,记录了压缩列表起始位置到压缩列表尾节

  • Redis中5种数据结构的使用场景介绍

    一.redis 数据结构使用场景 原来看过 redisbook 这本书,对 redis 的基本功能都已经熟悉了,从上周开始看 redis 的源码.目前目标是吃透 redis 的数据结构.我们都知道,在 redis 中一共有5种数据结构,那每种数据结构的使用场景都是什么呢? String--字符串 Hash--字典 List--列表 Set--集合 Sorted Set--有序集合 下面我们就来简单说明一下它们各自的使用场景: 1. String--字符串 String 数据结构是简单的 key-

  • 详解redis数据结构之sds

    详解redis数据结构之sds 字符串在redis中使用非常广泛,在redis中,所有的数据都保存在字典(Map)中,而字典的键就是字符串类型,并且对于很大一部分字典值数据也是又字符串组成的.以下是sds的具体存储结构: 从图中可以看出,sds的属性有三个:len.free和buf数组.这里len字段是用来保存sds字符串中所包含字符数目的,free字段则是用来保存buf数组中空余的部分的长度的,而buf数组则是实际用来保存字符串的.比如如下结构保存了"Hello World!"这个字

  • redis数据结构之intset的实例详解

    redis数据结构之intset的实例详解 在redis中,intset主要用于保存整数值,由于其底层是使用数组来保存数据的,因而当对集合进行数据添加时需要对集合进行扩容和迁移操作,因而也只有在数据量不大时redis才使用该数据结构来保存整数集合.其具体的底层数据结构如下: typedef struct intset { // 编码方式 uint32_t encoding; // 集合包含的元素数量 uint32_t length; // 保存元素的数组 int8_t contents[]; }

  • redis中的数据结构和编码详解

    redis中的数据结构和编码:     背景: 1>redis在内部使用redisObject结构体来定义存储的值对象. 2>每种类型都有至少两种内部编码,Redis会根据当前值的类型和长度来决定使用哪种编码实现. 3>编码类型转换在Redis写入数据时自动完成,这个转换过程是不可逆的,转换规则只能从小内存编码向大内存编码转换.     源码: 值对象redisObject: typedef struct redisObject {                 unsigned ty

  • golang redis中Pipeline通道的使用详解

    目录 一.pipeline出现的背景 二.pipeline的用法 pipeline命令的使用 goredis库连接客户端 package client import (     "github.com/go-redis/redis"     "github.com/sirupsen/logrus" ) var MainRDS *redis.Client func init() {     ConnectRedis() } func ConnectRedis() {

  • 在Redis中如何保存时间序列数据详解

    目录 时间序列数据的读写特点 基于Hash和Sorted Set保存时间序列数据 基于RedisTimeSeries模块保存时间序列数据 1.用TS.CREATE命令创建一个时间序列数据集合 2.用TS.ADD命令插入数据,用TS.GET命令读取最新数据 3.用TS.MGET命令按标签过滤查询数据集合 4.用TS.RANGE支持需要聚合计算的范围查询 小结 每课一问 总结 我们现在做互联网产品的时候,都有这么一个需求:记录用户在网站或者App上的点击行为数据,来分析用户行为.这里的数据一般包括用

  • Redis中的数据过期策略详解

    1.Redis中key的的过期时间 通过EXPIRE key seconds命令来设置数据的过期时间.返回1表明设置成功,返回0表明key不存在或者不能成功设置过期时间.在key上设置了过期时间后key将在指定的秒数后被自动删除.被指定了过期时间的key在Redis中被称为是不稳定的. 当key被DEL命令删除或者被SET.GETSET命令重置后与之关联的过期时间会被清除 127.0.0.1:6379> setex s 20 1 OK 127.0.0.1:6379> ttl s (intege

  • Redis数据结构之链表详解

    目录 1 链表和链表节点的结构 2 链表相关的API 1 链表和链表节点的结构 1.1 节点结构 节点的结构大概长下边这个样子: 那么,把这些节点就连起来就成了这个样子: 1.2 链表结构 链表自然除了要把这些节点连起来,还得保存一些其他的信息,不然也太简单了,对吧.那么链表的结构大概长下边这个样子: head:指向链表的表头的指针tail:指向链表的表尾的指针len:记录链表的长度dup:函数用于复制链表节点所保存的值free:函数用于释放链表节点所保存的值match:函数则用于对比链表节点所

  • Go语言中的数据竞争模式详解

    目录 前言 Go在goroutine中通过引用来透明地捕获自由变量 切片会产生难以诊断的数据竞争 并发访问Go内置的.不安全的线程映射会导致频繁的数据竞争 Go开发人员常在pass-by-value时犯错并导致non-trivial的数据竞争 消息传递(通道)和共享内存的混合使用使代码变得复杂且易受数据竞争的影响 Add和Done方法的错误放置会导致数据竞争 并发运行测试会导致产品或测试代码中的数据竞争 小结 前言 本文主要基于在Uber的Go monorepo中发现的各种数据竞争模式,分析了其

  • JSP中EL表达式的用法详解(必看篇)

    EL 全名为Expression Language EL 语法很简单,它最大的特点就是使用上很方便.接下来介绍EL主要的语法结构: ${sessionScope.user.sex} 所有EL都是以${为起始.以}为结尾的.上述EL范例的意思是:从Session的范围中,取得 用户的性别.假若依照之前JSP Scriptlet的写法如下: User user =(User)session.getAttribute("user"); String sex =user.getSex( );

  • Redis 实现队列原理的实例详解

    Redis 实现队列原理的实例详解 场景说明: ·用于处理比较耗时的请求,例如批量发送邮件,如果直接在网页触发执行发送,程序会出现超时 ·高并发场景,当某个时刻请求瞬间增加时,可以把请求写入到队列,后台在去处理这些请求 ·抢购场景,先入先出的模式 命令: rpush + blpop 或 lpush + brpop rpush : 往列表右侧推入数据 blpop : 客户端阻塞直到队列有值输出 简单队列: simple.php $stmt = $pdo->prepare('select id, c

  • Java中正则表达式的使用和详解(下)

    在上篇给大家介绍了Java中正则表达式的使用和详解(上),具体内容如下所示: 1.常用正则表达式 规则 正则表达式语法   一个或多个汉字 ^[\u0391-\uFFE5]+$  邮政编码 ^[1-9]\d{5}$ QQ号码 ^[1-9]\d{4,10}$  邮箱 ^[a-zA-Z_]{1,}[0-9]{0,}@(([a-zA-z0-9]-*){1,}\.){1,3}[a-zA-z\-]{1,}$  用户名(字母开头 + 数字/字母/下划线) ^[A-Za-z][A-Za-z1-9_-]+$ 手

  • JavaScript数据结构链表知识详解

    最近在看<javascript数据结构和算法>这本书,补一下数据结构和算法部分的知识,觉得自己这块是短板. 链表:存储有序的元素集合,但不同于数组,链表中的元素在内存中不是连续放置的.每个元素由一个存储元素本身的节点和一个指向下一个元素的引用(也称指针或链接)组成. 好处:可以添加或移除任意项,它会按需扩容,且不需要移动其他元素. 与数组的区别: 数组:可以直接访问任何位置的任何元素: 链表:想要访问链表中的一个元素,需要从起点(表头)开始迭代列表直到找到所需的元素. 做点小笔记. funct

随机推荐