EventStore文件存储设计详解

2025-04-01 16:56:52

背景

ENode是一个CQRS+Event Sourcing架构的开发框架，Event Sourcing需要持久化事件，事件可以持久化在DB，但是DB由于面向的是CRUD场景，是针对数据会不断修改或删除的场景，所以内部实现会比较复杂，性能也相对比较低。而Event Store实际上对数据只有新增和查询的需求，所以我想为Event Sourcing的场景针对性的实现一个Event Store。看了一下业界的一些实现，感觉都没有达到我的期望，所以想自己动手实现一个。下面是我构思的一个Event Store的单机版应该要具备的能力以及对应的设计方案，分享出来和大家讨论。

一、需求概述

•存储聚合根的事件数据
•支持事件的版本并发控制，新事件的版本号必须是当前版本号+1
•支持命令重复判断，即不可以处理重复命令产生的事件
•支持按聚合根ID查询该聚合根的所有事件
•支持按聚合根ID+事件版本号查询指定的事件
•支持按命令ID查询该命令对应的事件数据
•高性能，写入要尽量快，查询要尽量快

二、事件数据格式

{
 "aggregateRootId": "",   //聚合根ID
 "aggregateRootType": "",  //聚合根类型
 "eventVersion": "",    //事件版本号
 "eventTime": "",      //事件发生时间
 "eventData": "",      //事件数据，JSON格式
 "commandId": "",      //产生该事件的命令ID
 "commandTime": ""     //产生该事件的命令产生时间
}

三、存储设计

1、核心内存存储设计

•遵循内存只存储索引数据的原则，尽量充分利用内存；
•aggregateLatestVersionDict，存储每个聚合根的最大事件版本号 ◦key：aggregateRootId，聚合根ID
◦value： ◦eventVersion，当前聚合根的最新事件的版本号，也即当前聚合根的版本号
◦eventTime，事件产生时间
◦eventPosition，事件在事件数据文件中的位置

•commandIdDict，存储命令索引 ◦key：commandId，命令ID
◦value： ◦commandTime，命令产生时间
◦eventPosition，命令对应的事件在事件数据文件中的位置

2、物理存储的数据

•事件数据：eventData，单条数据的结构：

{
 "aggregateRootId": "",   //聚合根ID
 "aggregateRootType": "",  //聚合根类型
 "eventVersion": "",    //事件版本号
 "eventTime": "",      //事件发生时间
 "eventData": "",      //事件数据，JSON格式
 "commandId": "",      //产生该事件的命令ID
 "commandTime": "",     //产生该事件的命令产生的事件
 "previousEventPosition": ""//前一个事件在事件文件中的位置
}

•事件索引：eventIndex，单条数据的结构：

{
 "aggregateRootId": "",   //聚合根ID
 "eventVersion": "",    //事件版本号
 "eventTime": "",      //事件产生时间
 "eventPosition": "",    //事件在事件数据文件中的位置
}

•命令索引：commandIndex，存储内容：存储所有命令的ID及其对应的事件所在文件的位置

{
 "commandId": "",    //聚合根ID
 "commandTime": "",   //命令产生时间
 "eventPosition": "",  //事件在事件数据文件中的位置
}

3、事件数据存储

•同步顺序写eventDataChunk文件，一个文件大小为1GB，写满一个文件后写入下一个文件；
•写入每个事件时，同时写入当前事件的前一个事件所在的文件位置，以便将来可以一次性将某个聚合根的所有事件从文件查找出来；

4、事件索引存储

•异步顺序写eventIndexChunk文件，一个文件大小为1GB，写满一个文件后写入下一个文件；
•对于已经写满的不会再变化的文件的内容，使用后台线程进行B+树索引整理，索引的排序依据是聚合根ID+事件版本号；B+树设计为3层，根节点包含1000个子节点，每个子节点再包含1000个子节点，这样叶子节点共有100W个。每个叶子节点我们保存20个版本索引，则单个文件共可保存最多2000W个版本索引，10个文件为2亿个版本索引；单机存储2亿个事件索引，应该可以满足大部分应用场景了；3层，则查找任意一个节点，只需要3次IO访问；
•由于是后台线程对已经写完的文件进行B+树索引整理，B+树是在内存建立，建立完成后，将最新的内容写入新文件，原子替换老的eventIndexChunk文件；所以，这块的逻辑处理应该不会对服务的主逻辑产生较大的影响；
•采用BloomFilter优化查询性能，使用BloomFilter来快速判断某个eventIndexChunk文件中是否包含某个聚合根ID，如果不在，则不用从B+树去检索该聚合根的版本号了；如果在，则取检索；通过这个设计，当我们要获取某个聚合根的最大版本号时，不需要对每个eventIndexChunk文件进行B+树查询，而是先通过BloomFilter快速判断当前的eventIndexChunk文件是否包含该聚合根的信息，大大提升检索效率；BloomFilter的二进制Bit数据占用内存小，可以在每个eventIndexChunk文件被扫描时，和文件头的信息一起加载到内存；

5、命令索引存储

•异步顺序写commandIndexChunk文件，一个文件大小为1GB，写满一个文件后写入下一个文件；
•同事件索引存储，进行B+树索引建立，索引的排序依据是命令ID；
•同事件索引存储，采用BloomFilter优化查询性能；

四、框架逻辑设计

1、查询某个聚合根的最大版本号

•EventStore启动时，会加载所有的eventIndexChunk文件的元数据到内存，比如文件号、文件头、BloomFilter等信息，但不真实加载文件内容，文件数不会太多，最多也就几十个；
•根据聚合根ID+BloomFilter算法，快速确定应该到哪个eventIndexChunk文件中去查找该聚合根的最新版本号，eventIndexChunk文件从新到旧遍历，因为某个聚合根ID的最大版本号一定是在最新的eventIndexChunk文件中的；
•在找到的eventIndexChunk中使用B+树查找算法，找到对应的叶子节点；
•在找到的叶子节点，使用二分查找算法（由于单个节点的聚合根ID不多，顺序查找即可），找到指定聚合根的最新版本号；

2、查询某个聚合根的所有事件

•先通过上面的算法找出该聚合根的最大版本号的事件在事件数据文件中的位置；
•然后从该位置获取事件完整数据；
•再根据事件数据中记录的上一个事件在事件数据文件中的位置，查找上一个事件的数据；
•以此类推，直到找到该聚合根的第一个事件的数据；

3、查询某个命令对应的事件数据

•先尝试从内存查询该命令的索引信息，如果存在，则直接获取该命令对应的事件在事件数据文件中的位置，即eventPosition；如果不存在，则尝试从命令的索引文件中查找，结合BloomFilter和B+树查找算法进行查找；
•如果找到了eventPosition，则根据eventPosition到事件数据文件中查找对应的事件数据即可；如果未找到，则返回空；

4、追加一个新事件的处理逻辑

•根据aggregateLatestVersionDict判断事件版本号是否合法，必须是聚合根的当前版本号+1，如果当前版本号不存在，则首先尝试从eventIndexChunk文件查找当前聚合根的最大版本号，如果还是查找不到，说明当前聚合根确实不存在任何事件，则当前事件版本号必须为1；
•根据commandIdDict判断命令ID是否重复，如果commandIdDict中不存在该命令，尝试从commandIndexChunk文件中查找，也是B+树的方式；这里需要设计一个配置项，让开发者配置是否需要继续从commandIndexChunk文件查找命令ID。有时我们只希望从内存查找即可，不希望再从磁盘查找了，因为判断命令是否重复我们很多时候只希望检查最近一段时间内的命令，检查全部命令代价过大，意义也不是很大；
•如果事件的版本号合法、命令ID不重复，则Append的方式写入事件数据到eventDataChunk；
•写入完成后，更新aggregateLatestVersionDict、commandIdDict，、BloomFilter的Bit数组，以及将当前的事件放入内存的一个双缓冲队列；队列消费者异步批量将事件索引和命令索引写入对应的索引文件；
•返回事件写入结果；

5、其他逻辑

•异步线程定时批量持久化事件索引；
•异步线程定时批量持久化命令索引；
•异步线程定时清理不需要放在内存的聚合根最新版本号信息（aggregateLatestVersionDict中的key），根据eventTime判断，只保留最近1周有过变化（产生过事件）的聚合根；
•异步线程定时清理不需要放在内存的命令索引（commandIdDict中的key），根据commandTime判断，只保留最近1周的命令ID；
•异步线程定时进行事件索引和命令索引的B+树索引的建立，即对已经写入完成的eventIndexChunk和commandIndexChunk文件的内部重构；
•eventIndexChunk和commandIndexChunk文件标记为写入完成前，要把BloomFilter的Bit数组内容写入文件中；
•其他EventStore的启动逻辑，比如启动时加载一定数量的索引数据到内存，以及索引数据相比事件数据是否有漏掉或无效的检查；
•其他逻辑支持，如支持聚合根的快照存储，从文件查找数据时，如果文件的B+树索引信息还未建立，则需要进行全文扫码；

总结

以上所述是小编给大家介绍的EventStore文件存储设计详解,希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对我们网站的支持！
如果你觉得本文对你有帮助，欢迎转载，烦请注明出处，谢谢！

MySQL数据文件存储位置的查看方法

我们可能会有一个疑惑,那就是:当我们在本地(自己的电脑)安装完 MySQL 之后,也创建了很多的数据库啊.表啊,也存储了很多的数据啊,但是这些内容都存储到哪里了呢?特别是,当我们需要直接操作这些数据文件的时候,翻遍了整个电脑,却找不到 MySQL 的数据文件到底在哪里,这就有些坑爹啦! 在这里,教给大家一个非常简单的能够立即定位到 MySQL 数据文件的存储位置方法,即在 MySQL 客户端键入如下命令: show global variables like "%datadir%";
详解如何在python中读写和存储matlab的数据文件(*.mat)

背景在做deeplearning过程中,使用caffe的框架,一般使用matlab来处理图片(matlab处理图片相对简单,高效),用python来生成需要的lmdb文件以及做test产生结果.所以某些matlab从图片处理得到的label信息都会以.mat文件供python读取,同时也python产生的结果信息也需要matlab来做进一步的处理(当然也可以使用txt,不嫌麻烦自己处理结构信息). 介绍 matlab和python间的数据传输一般是基于matlab的文件格式.mat,pytho
numpy的文件存储.npy .npz 文件详解

Numpy能够读写磁盘上的文本数据或二进制数据. 将数组以二进制格式保存到磁盘 np.load和np.save是读写磁盘数组数据的两个主要函数,默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中. import numpy as np a=np.arange(5) np.save('test.npy',a) 这样在程序所在的文件夹就生成了一个test.npy文件将test.npy文件中的文件读出来 import numpy as np a=np.load('test.np
PHP实现抓取百度搜索结果页面【相关搜索词】并存储到txt文件示例

本文实例讲述了PHP实现抓取百度搜索结果页面[相关搜索词]并存储到txt文件.分享给大家供大家参考,具体如下: 一.百度搜索关键词[我们] [我们]搜索链接 https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=0&rsv_idx=1&tn=baidu&wd=%E8%84%9A%E6%9C%AC%E4%B9%8B%E5%AE%B6&rsv_pq=ab33cfeb000086a2&rsv_t=7c65vT3KzHCNf
Android开发实现读取Assets下文件及文件写入存储卡的方法

本文实例讲述了Android开发实现读取Assets下文件及文件写入存储卡的方法.分享给大家供大家参考,具体如下: 调用一个反编译的.so文件,查看起加密和解密情况,需要解析上万的数组,而so文件加密解密都是通过Byte来进行,又需要把String字符串转化为 Byte,当把数据直接写在代码中就会提示多Byte数组过大.最后把数组写到Assets文件加下,读取txt文本文件. 读取Assets方法如下: public String getFromAssets(String fileName) {
详解MySQL中InnoDB的存储文件

从物理意义上来讲,InnoDB表由共享表空间文件(ibdata1).独占表空间文件(ibd).表结构文件(.frm).以及日志文件(redo文件等)组成. 1.表结构文件在MYSQL中建立任何一张数据表,在其数据目录对应的数据库目录下都有对应表的.frm文件,.frm文件是用来保存每个数据表的元数据(meta)信息,包括表结构的定义等,.frm文件跟数据库存储引擎无关,也就是任何存储引擎的数据表都必须有.frm文件,命名方式为数据表名.frm,如user.frm. .frm文件可以用来在数据库
EventStore文件存储设计详解

背景 ENode是一个CQRS+Event Sourcing架构的开发框架,Event Sourcing需要持久化事件,事件可以持久化在DB,但是DB由于面向的是CRUD场景,是针对数据会不断修改或删除的场景,所以内部实现会比较复杂,性能也相对比较低.而Event Store实际上对数据只有新增和查询的需求,所以我想为Event Sourcing的场景针对性的实现一个Event Store.看了一下业界的一些实现,感觉都没有达到我的期望,所以想自己动手实现一个.下面是我构思的一个Event St
PHP中如何使用Redis接管文件存储Session详解

前言 php默认使用文件存储session,如果并发量大,效率会非常低.而redis对高并发的支持非常好,可以利用redis替换文件来存储session. 最近就遇到了这个问题,之前找了网上的一套直播系统给客户用,刚开始是没问题的,在后面人数上来之后网站开始变得卡顿,卡的一批.之后查看php慢日志发现session_start()的身影,好吧,原来是万恶的文件存储session,跟我之前进的坑一模一样--之前做的教务查询系统直接用的session没有用cookie,结果在高并发的情况下php原地
Mysql文件存储图文详解

什么是文件系统我们知道像 InnoDB.MyIASM 这样的存储引擎都是把表存储在磁盘上的(持久化).当我们想读取数据的时候,这些存储引擎会从文件系统中把数据读出来返回给我们, 当我们想写入数据的时候,这些存储引擎会把这些数据又写回文件系统. 当然,MySQL除了存储实际的数据,还存储了一系列其他的日志,在这些也属于文件系统. 存储引擎的落盘文件地址使用客户端与服务器建立连接之后查看这个系统变量的值就可以了: show variables like 'datadir'; 当然这个目录可以通过
Android 文件存储与SharedPreferences存储方式详解用法

目录持久化技术简介文件存储 1. 将数据存储到文件中 2. 从文件中读取数据 SharedPreferences 存储 1. 将数据存储到 SharedPreferences 中 2. 从 SharedPreferences 中读取数据持久化技术简介数据持久化就是指将那些内存中的瞬时数据保存到存储设备中,保证即使在手机或计算机关机的情况下,这些数据也不会丢失.保存在内存中的数据是处于瞬时状态的,而保存在存储设备的数据是处于持久状态的.持久化技术提供了一种机制,可以让数据在瞬时状态和持久状
MySQL高级学习笔记（三）：Mysql逻辑架构介绍、mysql存储引擎详解

Mysql逻辑架构介绍总体概览和其它数据库相比,MySQL有点与众不同,它的架构可以在多种不同场景中应用并发挥良好作用.主要体现在存储引擎的架构上,插件式的存储引擎架构将查询处理和其它的系统任务以及数据的存储提取相分离 . 这种架构可以根据业务的需求和实际需要选择合适的存储引擎. controller层: Connectors:连接层,c .java等连接mysql 业务逻辑处理成: Connection Pool:连接层 c3p0连接池等 Manager Service util:备份.容灾
Android 原始资源文件的使用详解

背景知识介绍与其他平台的应用程序一样,Android中的应用程序也会使用各种资源,比如图片,字串等,会把它们放入源码的相应文件夹下面,如/res/drawable, /res/xml, /res/values/, /res/raw, /res/layout和/assets.Android也支持并鼓励开发者把UI相关的布局和元素,用XML资源来实现.总结起来,Android中支持的资源有:•颜色值 /res/values 以resourc
.NetCore实现上传多文件的示例详解

本章和大家分享的是.NetCore的MVC框架上传文件的示例,主要讲的内容有:form方式提交上传,ajax上传,ajax提交+上传进度效果,Task并行处理+ajax提交+上传进度,相信当你读完文章内容后能后好的收获,如果可以不妨点个赞:由于昨天电脑没电了,快要写完的内容没有保存,今天早上提前来公司从头开始重新,断电这情况的确让人很头痛啊,不过为了社区的分享环境,这也是值得的,不多说了来进入今天的正篇环节吧: form方式上传一组图片先来看看咋们html的代码,这里先简单说下要上传文件必须要
Android本地存储SharedPreferences详解

Android本地存储SharedPreferences详解存储位置 SharedPreferences数据保存在: /data /data/<package_name> /shared_prefs 文件夹下,以XML格式保存,根元素为:<map />.文件名称为获取SharedPreferences实例时传递的參数值. <map> <int name="key" value="value" /> <strin
对pandas写入读取h5文件的方法详解

1.引言通过参考相关博客对hdf5格式简要介绍. hdf5在存储的是支持压缩,使用的方式是blosc,这个是速度最快的也是pandas默认支持的. 使用压缩可以提磁盘利用率,节省空间. 开启压缩也没有什么劣势,只会慢一点点. 压缩在小数据量的时候优势不明显,数据量大了才有优势. 同时发现hdf读取文件的时候只能是一次写,写的时候可以append,可以put,但是写完成了之后关闭文件,就不能再写了, 会覆盖. 另外,为什么单独说pandas,主要因为本人目前对于h5py这个包的理解不是很深入,不
C++中#include头文件的示例详解

fstream是C++ STL中对文件操作的合集,包含了常用的所有文件操作.在C++中,所有的文件操作,都是以流(stream)的方式进行的,fstream也就是文件流file stream. 最常用的两种操作为: 1.插入器(<<) 向流输出数据.比如说打开了一个文件流fout,那么调用fout<<"Write to file"<<endl;就表示把字符串"Write to file"写入文件并换行. 2.析取器(>>