Java并发编程数据库与缓存数据一致性方案解析

2025-03-29 22:05:36

一、序言

在分布式并发系统中，数据库与缓存数据一致性是一项富有挑战性的技术难点。本文将讨论数据库与缓存数据一致性问题，并提供通用的解决方案。

假设有完善的工业级分布式事务解决方案，那么数据库与缓存数据一致性便迎刃而解，实际上，目前分布式事务不成熟。

二、不同的声音

在数据库与缓存数据一致解决方式中，有各种声音。

先操作数据库后缓存还是先缓存后数据库
缓存是更新还是删除

1、操作的先后顺序

在并发系统中，数据库与缓存双写场景下，为了追求更大的并发量，操作数据库与缓存显而易见不会同步进行。前者操作成功后者以异步的方式进行。

关系型数据库作为成熟的工业级数据存储方案，有完善的事务处理机制，数据一旦落盘，不考虑硬件故障，可以负责任的说数据不会丢失。

所谓缓存，无非是存储在内存中的数据，服务一旦重启，缓存数据全部丢失。既然称之为缓存，那么时刻做好了缓存数据丢失的准备。尽管Redis有持久化机制，是否能够保证百分之百持久化？Redis将数据异步持久化到磁盘有不可，缓存是缓存，数据库是数据库，两个不同的东西。把缓存当数据库使用是一件极其危险的事情。

从数据安全的角度来讲，先操作数据库，然后以异步的方式操作缓存，响应用户请求。

2、处理缓存的态度

缓存是更新还是删除，对应懒汉式和饱汉式，从处理线程安全实践来讲，删除缓存操作相对难度低一些。如果在删除缓存的前提下满足了查询性能，那么优先选择删除缓存。

更新缓存尽管能够提高查询效率，然后带来的线程并发脏数据处理起来较麻烦，序言引入MQ等其它消息中间件，因此非必要不推荐。

三、线程并发分析

理解线程并发所带来问题的关键是先理解系统中断，操作系统在任务调度时，中断随时都在发生，这是线程数据不一致产生的根源。以4和8线程CPU为例，同一时刻最多处理8个线程，然而操作系统管理的线程远远超过8个，因此线程们以一种看似并行的方式进行。

查询数据

1、非并发环境

在非并发环境中，使用如下方式查询数据并无不妥：先查询缓存，如果缓存数据不存在，查询数据库，更新缓存，返回结果。

public BuOrder getOrder(Long orderId) {
    String key = ORDER_KEY_PREFIX + orderId;
    BuOrder buOrder = RedisUtils.getObject(key, BuOrder.class);
    if (buOrder != null) {
        return buOrder;
    }
    BuOrder order = getById(orderId);
    RedisUtils.setObject(key, order, 5, TimeUnit.MINUTES);
    return order;
}

如果在高并发环境中有一个严重缺陷：当缓存失效时，大量查询请求涌入，瞬间全部打到DB上，轻则数据库连接资源耗尽，用户端响应500错误，重则数据库压力过大服务宕机。

2、并发环境

因此在并发环境中，需要对上述代码进行修改，使用分布式锁。大量请求涌入时，获得锁的线程有机会访问数据库查询数据，其余线程阻塞。当查询完数据并更新缓存，然后释放锁。等待的线程重新检查缓存，发现能够获取到数据，直接将缓存数据响应。

这里提到分布式锁，那么使用表锁还是行锁呢？使用分布式行锁提高并发量；使用二次检查机制，确保等待获得锁的线程能够快速返回结果

@Override
public BuOrder getOrder(Long orderId) {
    /* 如果缓存不存在，则添加分布式锁更新缓存 */
    String key = ORDER_KEY_PREFIX + orderId;
    BuOrder order = RedisUtils.getObject(key, BuOrder.class);
    if (order != null) {
        return order;
    }
    String orderLock = ORDER_LOCK + orderId;
    RLock lock = redissonClient.getLock(orderLock);
    if (lock.tryLock()) {
        order = RedisUtils.getObject(key, BuOrder.class);
        if (order != null) {
            LockOptional.ofNullable(lock).ifLocked(RLock::unlock);
            return order;
        }
        BuOrder buOrder = getById(orderId);
        RedisUtils.setObject(key, buOrder, 5, TimeUnit.MINUTES);
        LockOptional.ofNullable(lock).ifLocked(RLock::unlock);
    }
    return RedisUtils.getObject(key, BuOrder.class);
}

更新数据

1、非并发环境

非并发环境中，如下代码尽管可能会产生数据不一致问题（数据被覆盖）。尽管使用数据库层面乐观锁能够解决数据被覆盖问题，然而无效更新流量依旧会流向数据库。

public Boolean editOrder(BuOrder order) {
    /* 更新数据库 */
    updateById(order);
    /* 删除缓存 */
    RedisUtils.deleteObject(OrderServiceImpl.ORDER_KEY_PREFIX + order.getOrderId());
    return true;
}

2、并发环境

上面分析中使用数据库乐观锁能够解决并发更新中数据被覆盖的问题，然而当同一行记录被修改后，版本号发生改变，后续并发流向数据库的请求为无效流量。减小数据库压力的首要策略是将无效流量拦截在数据库之前。

使用分布式锁能够保证并发流量有序访问数据库，考虑到数据库层面已经使用了乐观锁，第二个及以后获得锁的线程操作数据库为无效流量。

线程在获得锁时采用超时退出的策略，等待获得锁的线程超时快速退出，快速响应用户请求，重试更新数据操作。

public Boolean editOrder(BuOrder order) {
    String orderLock = ORDER_LOCK + order.getOrderId();
    RLock lock = redissonClient.getLock(orderLock);
    try {
        /* 超时未获取到锁，快速失败，用户端重试 */
        if (lock.tryLock(1, TimeUnit.SECONDS)) {
            /* 更新数据库 */
            updateById(order);
            /* 删除缓存 */
            RedisUtils.deleteObject(OrderServiceImpl.ORDER_KEY_PREFIX + order.getOrderId());
            /* 释放锁 */
            LockOptional.ofNullable(lock).ifLocked(RLock::unlock);
            return true;
        }
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
    return false;
}

依赖环境

上述代码使用了封装锁的工具类。

<dependency>
  <groupId>xin.altitude.cms</groupId>
  <artifactId>ucode-cms-common</artifactId>
  <version>1.4.3.2</version>
</dependency>

LockOptional根据锁的状态执行后续操作。

四、先数据库后缓存

数据一致性

1、问题描述

接下来讨论先更新数据库，后删除缓存是否存在并发问题。

（1）缓存刚好失效
（2）请求A查询数据库，得一个旧值
（3）请求B将新值写入数据库
（4）请求B删除缓存
（5）请求A将查到的旧值写入缓存

上述并发问题出现的关键是第5步比第3、4步后发生，由操作系统中断不确定因素可知，此种情况却有发生的可能。

2、解决方式

从实际情况来看，将数据写入Redis远比将数据写入数据库耗时要短，尽管发生的概率较低，但仍会发生。

（1）增加缓存过期时间

增加缓存过期时间允许一定时间范围内脏数据存在，直到下一次并发更新出现，可能会出现脏数据。脏数据会周期性存在。

（2）更新和查询共用一把行锁

更新和查询共用一把行分布式锁，上述问题不复存在。当读请求获取到锁时，写请求处于阻塞状态（超时会快速失败返回），能够保证步骤5在步骤3之前进行。

（3）延迟删除缓存

使用RabbitMQ延迟删除缓存，去除步骤5的影响。使用异步的方式进行，几乎不影响性能。

特殊情况

数据库有事务机制保证操作成功与否；Redis单条指令具有原子性，然后组合起来却不具备原子特征，具体来说是数据库操作成功，然后应用异常挂掉，导致Redis缓存未删除。Redis服务网络连接超时出现此问题。

如果设置有缓存过期时间，那么在缓存尚未过期前，脏数据一直存在。如果未设置过期时间，那么直到下一次修改数据前，脏数据一直存在。（数据库数据已经发生改变，缓存尚未更新）

解决方式

在操作数据库前，向RabbitMQ写入一条延迟删除缓存的消息，然后执行数据库操作，执行缓存删除操作。不管代码层面缓存是否删除成功，MQ删除缓存作为保底操作。

五、小结

上述方式提供的数据库与缓存数据一致性解决方式，属于耦合版，当然还有订阅binlog日志的解耦版。解耦版由于增加了订阅binlog组件，对系统稳定性提出更高的要求。

数据库与缓存一致性问题看似是解决数据问题，实质上解决并发问题：在尽可能保证更多并发量的前提下，在保证数据库安全的前提下，保证数据库与缓存数据一致。

以上就是数据库与缓存数据一致性方案解析的详细内容，更多关于数据库缓存数据一致性的资料请关注我们其它相关文章！

使用SpringCache进行缓存数据库查询方式

目录 SpringCache进行缓存数据库查询 1.在SpringBoot的启动类上添加注解@EnableCaching 2.在service的方法上添加对应的注解 SpringCache 数据库一致性问题缓存和数据库不一致的问题先更新数据库,再更新缓存高并发下redis和数据库不一致问题 SpringCache进行缓存数据库查询 1.在SpringBoot的启动类上添加注解@EnableCaching 开启SpringCache缓存支持 @SpringBootApplication //
高并发下Redis如何保持数据一致性(避免读后写)

“读后写” 通常意义上我们说读后写是指针对同一个数据的先读后写,且写入的值依赖于读取的值. 关于这个定义要拆成两部分来看,一:同一个数据:二:写依赖于读.(记住这个拆分,后续会用到,记为定义一.定义二)只有当这两部分都成立时,读后写的问题才会出现. 在项目中,当面对较多的并发时,使用redis进行读后写操作,是非常容易出问题的,常常使得程序不具备鲁棒性,bug很难稳定复现(得到的值往往跟并发数有关). 举个栗子: 存在A.B两个进程,同时操作下面这段代码: $objRedis = new Red
Spring AOP实现Redis缓存数据库查询源码

应用场景我们希望能够将数据库查询结果缓存到Redis中,这样在第二次做同样的查询时便可以直接从redis取结果,从而减少数据库读写次数. 需要解决的问题操作缓存的代码写在哪?必须要做到与业务逻辑代码完全分离. 如何避免脏读? 从缓存中读出的数据必须与数据库中的数据一致. 如何为一个数据库查询结果生成一个唯一的标识?即通过该标识(Redis中为Key),能唯一确定一个查询结果,同一个查询结果,一定能映射到同一个key.只有这样才能保证缓存内容的正确性如何序列化查询结果?查询结果可能是单个实体
Java业务中台确保数据一致性的解决方案

目录引言数据一致性原理预备知识 1.本地事务 2.分布式事务 (1)一个事务中包含了多数据库操作 (2)一个事务中包含了多服务访问同一数据库 (3)一个事务包含了多个微服务调用数据不一致引发的问题数据一致性解决方案 1.刚性事务 2.柔性事务 (1)TCC 模式 (2)可靠消息最终一致性总结引言随着业务的发展,微服务架构逐渐成为当下业务中台的主流架构形式,它不但解决了各个应用之间的解耦问题,同时也解决了单体应用的性能问题实现可扩展可动态伸缩的能力.如下图所示,业务中台就是将平台的通用
并发编程之Java内存模型顺序一致性

目录 1.数据竞争和顺序一致性 1.1 Java内存模型规范对数据竞争的定义 1.2 JMM对多线程程序的内存一致性做的保证 2.顺序一致性内存模型 2.1 特性 2.2 举例说明顺序一致性模型 2.3 同步程序的顺序一致性效果 2.4 未同步程序的执行特性 3. 64位long型和double型变量写原子性 3.1 CPU.内存和总线简述 3.2 long和double类型的操作简介: 顺序一致性内存模型是一个理论参考模型,处理器的内存模型和编程语言的内存模型都会以顺序一致性内存模型作为参照
Java并发编程数据库与缓存数据一致性方案解析

目录一.序言二.不同的声音 1.操作的先后顺序 2.处理缓存的态度三.线程并发分析查询数据 1.非并发环境 2.并发环境更新数据 1.非并发环境 2.并发环境依赖环境四.先数据库后缓存数据一致性 1.问题描述 2.解决方式特殊情况解决方式五.小结一.序言在分布式并发系统中,数据库与缓存数据一致性是一项富有挑战性的技术难点.本文将讨论数据库与缓存数据一致性问题,并提供通用的解决方案. 假设有完善的工业级分布式事务解决方案,那么数据库与缓存数据一致性便迎刃而解,实际上,目前
Java 并发编程:volatile的使用及其原理解析

Java并发编程系列[未完]: •Java 并发编程:核心理论 •Java并发编程:Synchronized及其实现原理 •Java并发编程:Synchronized底层优化(轻量级锁.偏向锁) •Java 并发编程:线程间的协作(wait/notify/sleep/yield/join) •Java 并发编程:volatile的使用及其原理一.volatile的作用在<Java并发编程:核心理论>一文中,我们已经提到过可见性.有序性及原子性问题,通常情况下我们可以通过Synchroniz
Java并发编程之关键字volatile的深入解析

目录前言一.可见性二.有序性总结前言 volatile是研究Java并发编程绕不过去的一个关键字,先说结论: volatile的作用: 1.保证被修饰变量的可见性 2.保证程序一定程度上的有序性 3.不能保证原子性下面,我们将从理论以及实际的案例来逐个解析上面的三个结论一.可见性什么是可见性? 举个例子,小明和小红去看电影,刚开始两个人都还没买电影票,小红就先去买了两张电影票,没有告诉小明.小明以为小红没买,所以也去买了两张电影票,因为他们只有两个人,所以他们只能用两张票,这就是
JAVA并发编程有界缓存的实现详解

JAVA并发编程有界缓存的实现 1.有界缓存的基类 package cn.xf.cp.ch14; /** * *功能:有界缓存实现基类 *时间:下午2:20:00 *文件:BaseBoundedBuffer.java *@author Administrator * * @param <V> */ public class BaseBoundedBuffer<V> { private final V[] buf; private int tail; private int head
Java并发编程加锁导致的活跃性问题详解方案

目录死锁(Deadlock) 死锁的解决和预防 1.超时释放锁 2.按顺序加锁 3.死锁检测活锁(Livelock) 避免活锁饥饿解决饥饿性能问题上下文切换什么是上下文切换? 减少上下文切换的方法资源限制什么是资源限制资源限制引发的问题如何解决资源限制的问题我们主要处理锁带来的问题. 首先就是最出名的死锁死锁(Deadlock) 什么是死锁死锁是当线程进入无限期等待状态时发生的情况,因为所请求的锁被另一个线程持有,而另一个线程又等待第一个线程持有的另一个锁导致互相等
Java 并发编程学习笔记之核心理论基础

并发编程是Java程序员最重要的技能之一,也是最难掌握的一种技能.它要求编程者对计算机最底层的运作原理有深刻的理解,同时要求编程者逻辑清晰.思维缜密,这样才能写出高效.安全.可靠的多线程并发程序.本系列会从线程间协调的方式(wait.notify.notifyAll).Synchronized及Volatile的本质入手,详细解释JDK为我们提供的每种并发工具和底层实现机制.在此基础上,我们会进一步分析java.util.concurrent包的工具类,包括其使用方式.实现源码及其背后的原理.本
Java并发编程volatile关键字的作用

日常编程中出现 volatile 关键字的频率并不高,大家可能对 volatile 关键字比较陌生,再深入一点也许是听闻 volatile 只能保证可见性而不能保证原子性,无法有效保证线程安全,于是更加避免使用 volatile ,简简单单加上synchronize关键字就完事了.本文稍微深入探讨 volatile 关键字,分析其作用及对应的使用场景. 并发编程的几个概念简述首先简单介绍几个与并发编程相关的概念: 可见性可见性是指变量在线程之间是否可见,JVM 中默认情况下线程之间不具备可见
Java并发编程之阻塞队列深入详解

目录 1. 什么是阻塞队列 2. 阻塞队列的代码使用 3. 生产者消费者模型 (1)应用一:解耦合 (2)应用二:削峰填谷 (3)相关代码 4.阻塞队列和生产者消费者模型功能的实现 1. 什么是阻塞队列阻塞队列是一种特殊的队列,和数据结构中普通的队列一样,也遵守先进先出的原则同时,阻塞队列是一种能保证线程安全的数据结构,并且具有以下两种特性:当队列满的时候,继续向队列中插入元素就会让队列阻塞,直到有其他线程从队列中取走元素:当队列为空的时候,继续出队列也会让队列阻塞,直到有其他线程往队列中插入
深入分析java并发编程中volatile的实现原理

引言在多线程并发编程中synchronized和Volatile都扮演着重要的角色,Volatile是轻量级的synchronized,它在多处理器开发中保证了共享变量的"可见性".可见性的意思是当一个线程修改一个共享变量时,另外一个线程能读到这个修改的值.它在某些情况下比synchronized的开销更小,本文将深入分析在硬件层面上Inter处理器是如何实现Volatile的,通过深入分析能帮助我们正确的使用Volatile变量. 术语定义术语英文单词描述共享变量在多个线
Java并发编程Callable与Future的应用实例代码

本文主要探究的是java并发编程callable与future的使用,分享了相关实例代码,具体介绍如下. 我们都知道实现多线程有2种方式,一种是继承Thread,一种是实现Runnable,但这2种方式都有一个缺陷,在任务完成后无法获取返回结果.要想获得返回结果,就得使用Callable,Callable任务可以有返回值,但是没法直接从Callable任务里获取返回值:想要获取Callabel任务的返回值,需要用到Future.所以Callable任务和Future模式,通常结合起来使用. 试想