Redis源码阅读:Redis字符串SDS详解

SDS 基本概念

简单动态字符串(Simple Dynamic String)SDS,用作Redis 的默认字符串。

C语言中的字符串:以空字符结尾的字符数组

SDS实现举例

redis > SET msg "hello world"
OK

我们通过 SET 在 Redis 数据库中创建了一个数据键对象为 "msg" 和 数据值对象为 "hello world" 的键值对,其中数据键和数据值对象底层的字符串实现都是 SDS 。同时, SDS 还被用于 AOF 缓冲区。

SDS 定义

struct sdshdr {
    # 记录 buf 数组中已使用字节的数量,即当前字符串长度值
    # 等于 SDS 所保存字符串的字节长度
    int len;
    # 记录 buf 数组中未使用字节的数量,buf空余可用的长度,append时使用
    int free;
    # 字节char数组,用于保存字符串,实际保存字符串数据,最后一个字节保存了空字符 '\0'
    char buf[];
};

buf 属性的字节数组中的字符串长度等于 len 属性值加上1,因为 Redis遵循 C语言的规范,在SDS数据类型字符串的结尾加上了 空字符串,额外占用 1 个字节空间,这1个字节空间不计算在 SDS 的 len属性里面。

由于SDS将字符串的结尾加上了 空字符串符合C语言字符串规范,Redis 字符串操作可以兼容C语言中一部分字符串库中的函数,Redis 无需专门为 SDS在编写一套函数。

SDS的优点

常数复杂度获取字符串长度

  1. C字符串需要遍历整个字符串,计数,直到碰到空字符,停止计数,复杂度为O(N)
  2. SDS获取 len 属性值即可,复杂度为 O(1) 。所以 STRLEN 的复杂度也为 O(1)

API安全,杜绝缓冲区溢出

  1. C字符串在进行字符串拼接 strcat 时,需要预先分配足够的空间,来容纳拼接的字符串,否则会造成缓冲区溢出的问题,比如临近的空间有另外一个字符串。
  2. SDS 在进行字符串拼接时,会先检查 len 的长度是否足够,如果不够,会先扩展 len,再进行字符串拼接。

减少修改字符串长度时所需的内存重分配次数

  • 空间预分配
  • 当对 SDS 进行空间扩展时,计算扩展之后的 len值如果小于 1mb,那么久会分配 扩展之后的 len 值给 free 属性作为,为下次扩展时预分配的未使用空间,如果下次扩展所需字节空间小于 free 的值,那么就无需进行空间扩展,直接使用未使用空间。
  • 惰性空间释放
  • 同样,默认情况下,对 SDS 进行缩减时,缩减的空间不会立刻被这个SDS释放,而是分配给 free ,如果之后再进行扩展时,有可能会用到。
  • Redis 的 SDS 类型通过这两种空间分配策略,减少了字符串增长缩减时所需的内存重分配操作,为内存分配提供了优化。

二进制安全

Redis 通过 len属性的值来判断是否结束,而不是C字符串的 \0 作为结束。

兼容部分C字符串函数

上面已经提到SDS在末尾添加了 \0 ,这样可以兼容部分C字符串函数,可以直接使用 <string.h> 函数库。

Redis 字符串源码原理

1、Redis的字符串结构被设计成一个[SDS]结构

字符串实际内容是被存放在一个数组中,如下表

struct SDS<T> {
  T capacity; // 数组容量
  T len; // 数组实际长度
  byte flags; // 特殊标识位,不理睬它
  byte[] content; // 数组内容
}

当字符串的大小超出当前分配的capacity大小时,数组将扩容,分配更大的数组,将旧的数组拷贝到新数组中,再将增加到字符串添加进去。

2、embstr 与raw

1)Redis的字符串的储存方式分为2种,当长度特别短时,使用emb形式存储,当长度超出44时,使用raw存储。

2)俩者的区别:

Redis的对象头结构如下:

struct RedisObject {
    int4 type; // 4bits
    int4 encoding; // 4bits
    int24 lru; // 24bits
    int32 refcount; // 4bytes
    void *ptr; // 8bytes,64-bit system
} robj;

解析:不同的对象具有不同类型的type;同一个类型的type会有不同的存储形式encoding;使用lru来记录对象的LRU信息,每个对象都有一个引用计数,当计数为0的时候,对象就会被销毁,内存被回收;pre指针用来指示对象内容具体存储位置;上诉对象有结构内容加起来需要占用16字节的存储空间。

SDS对象头大小:实际内容的大小(capacity) + 3byte,3是用来存储capacity + len + flags内容加起来的长度,而content数组初始值是16,所有SDS最小的大小是19 (16+3 );

存储形式如下图:

解析:embstr将RedisObject对象头和SDS对象连续存在一起,使用malloc方法一次分配;而raw需要俩次malloc,俩个对象头砸死内存地址上一般是不连续的。embstr最大能容纳的字符串长度是44字节

3、扩容策略

字符串在长度小于1M之前,扩容空间采用加倍策略,即保留100%冗余空间。当长度大于1M,没次扩容只会多分配1M的冗余空间。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。

(0)

相关推荐

  • Redis字符串原理的深入理解

    前言 来掘进都有两年多了一直当个小透明,今天终于发一次文章了. 最近在看 Redis,感觉收获很多,写篇博客记录一下. Redis 有五种基础数据结构:string,list,set,zset,hash.其中 string是最最最简单的也是最常用的.这个数据类型虽然简单但是内部的结构设计却很是精致. 基本介绍 相比于 Java,在 Redis 中 string 是可以修改的,是动态字符串(Simple Dynamic String 简称 SDS)他的内部结构更像是一个 ArrayList,维护一

  • redis内部数据结构之SDS简单动态字符串详解

    前言 reids 没有直接使用C语言传统的字符串表示(以空字符结尾的字符数组)而是构建了一种名为简单动态字符串的抽象类型,并为redis的默认字符串表示,因为C字符串不能满足redis对字符串的安全性.效率以及功能方面的需求 1.SDS 定义 在C语言中,字符串是以'\0'字符结尾(NULL结束符)的字符数组来存储的,通常表达为字符指针的形式(char *).它不允许字节0出现在字符串中间,因此,它不能用来存储任意的二进制数据. sds的类型定义 typedef char *sds; 每个sds

  • Redis中的动态字符串学习教程

    sds 的用途 Sds 在 Redis 中的主要作用有以下两个: 实现字符串对象(StringObject): 在 Redis 程序内部用作 char* 类型的替代品: 以下两个小节分别对这两种用途进行介绍. 实现字符串对象 Redis 是一个键值对数据库(key-value DB), 数据库的值可以是字符串.集合.列表等多种类型的对象, 而数据库的键则总是字符串对象. 对于那些包含字符串值的字符串对象来说, 每个字符串对象都包含一个 sds 值. "包含字符串值的字符串对象",这种说

  • 详解redis数据结构之sds

    详解redis数据结构之sds 字符串在redis中使用非常广泛,在redis中,所有的数据都保存在字典(Map)中,而字典的键就是字符串类型,并且对于很大一部分字典值数据也是又字符串组成的.以下是sds的具体存储结构: 从图中可以看出,sds的属性有三个:len.free和buf数组.这里len字段是用来保存sds字符串中所包含字符数目的,free字段则是用来保存buf数组中空余的部分的长度的,而buf数组则是实际用来保存字符串的.比如如下结构保存了"Hello World!"这个字

  • Redis源码阅读:Redis字符串SDS详解

    SDS 基本概念 简单动态字符串(Simple Dynamic String)SDS,用作Redis 的默认字符串. C语言中的字符串:以空字符结尾的字符数组 SDS实现举例 redis > SET msg "hello world" OK 我们通过 SET 在 Redis 数据库中创建了一个数据键对象为 "msg" 和 数据值对象为 "hello world" 的键值对,其中数据键和数据值对象底层的字符串实现都是 SDS .同时, SDS

  • php源码 fsockopen获取网页内容实例详解

    PHP fsockopen函数说明: Open Internet or Unix domain socket connection(打开套接字链接) Initiates a socket connection to the resource specified by target . fsockopen() returns a file pointer which may be used together with the other file functions (such as fgets(

  • HashMap源码中的位运算符&详解

    引言 最近在读HashMap源码的时候,发现在很多运算符替代常规运算符的现象.比如说用hash & (table.length-1) 来替代取模运算hash&(table.length):用if((e.hash & oldCap) == 0)判断扩容后元素的位置等等. 1.取模运算符%底层原理 ​总所周知,位运算&直接对二进制进行运算:而对于取模运算符%:a % b 相当于 a - a / b * b,底层实际上是除法器,究其根源也是由底层的减法和加法共同完成.所以其运行效

  • Spring-boot 2.3.x源码基于Gradle编译过程详解

    spring Boot源码编译 1. git上下拉最新版的spring Boot 下载:git clone git@github.com:spring-projects/spring-boot.git,建议下载release版本,不会出现奇奇怪怪的错误 2.修改下载源, gradle\wrapper中的配置文件 gradle-wrapper.properties distributionBase=GRADLE_USER_HOME distributionPath=wrapper/dists #d

  • RocketMQ源码解析topic创建机制详解

    目录 1. RocketMQ Topic创建机制 2. 自动Topic 3. 手动创建--预先创建 通过界面控制台创建 1. RocketMQ Topic创建机制 以下源码基于Rocket MQ 4.7.0 RocketMQ Topic创建机制分为两种:一种自动创建,一种手动创建.可以通过设置broker的配置文件来禁用或者允许自动创建.默认是开启的允许自动创建 autoCreateTopicEnable=true/false 下面会结合源码来深度分析一下自动创建和手动创建的过程. 2. 自动T

  • java 源码分析Arrays.asList方法详解

    最近,抽空把java Arrays 工具类的asList 方法做了源码分析,在网上整理了相关资料,记录下来,希望也能帮助读者! Arrays工具类提供了一个方法asList, 使用该方法可以将一个变长参数或者数组转换成List . 其源代码如下: /** * Returns a fixed-size list backed by the specified array. (Changes to * the returned list "write through" to the arr

  • 基于Spring Boot的Environment源码理解实现分散配置详解

    前提 org.springframework.core.env.Environment是当前应用运行环境的公开接口,主要包括应用程序运行环境的两个关键方面:配置文件(profiles)和属性.Environment继承自接口PropertyResolver,而PropertyResolver提供了属性访问的相关方法.这篇文章从源码的角度分析Environment的存储容器和加载流程,然后基于源码的理解给出一个生产级别的扩展. 本文较长,请用一个舒服的姿势阅读. Environment类体系 Pr

  • MyBatis源码分析之日志logging详解

    前言 本文介绍个人对 logging 包下源码的理解.分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧 logging 配置加载 我们先从日志的配置加载开始阅读, MyBatis 的各项配置的加载过程都可以从 XMLConfigBuilder 类中找到,我们定位到该类下的日志加载方法 loadCustomLogImpl: private void loadCustomLogImpl(Properties props) { // 从 MyBatis 的 TypeAliasRegist

  • jQuery源码分析之sizzle选择器详解

    前言 Sizzle 原本是 jQuery 中用来当作 DOM 选择器的,后来被 John Resig 单独分离出去,成为一个单独的项目,可以直接导入到项目中使用. 点击这里下:jquery/sizzle. 本来我们使用 jQuery 当作选择器,选定一些 #id 或 .class,使用 document.getElementById 或 document.getElemensByClassName 就可以很快锁定 DOM 所在的位置,然后返回给 jQuery 当作对象.但有时候会碰到一些比较复杂

  • Android源码中的目录结构详解

    Android 2.1 |-- Makefile |-- bionic                        (bionic C库) |-- bootable                (启动引导相关代码) |-- build                        (存放系统编译规则及generic等基础开发包配置) |-- cts                        (Android兼容性测试套件标准) |-- dalvik                    

随机推荐