交互分布式系统下如何生成唯一序列

目录
  • 1 介绍
  • 2 数据库自增
  • 3 系统时间毫秒数
  • 4 UUID(GUID)
  • 5 批量预生成ID
  • 6 Redis生成唯一序列
  • 7 snowflake算法
  • 8 UidGenerator
  • 9 Leaf
  • 10 总结

1 介绍

在常见的业务场景中,比如全局订单Id,唯一标识的支付编号等,都需要这个来保证。

那生成ID都有哪些解决方案呢?特别是在复杂的分布式系统业务场景中,我们应该采用哪种解决方案来实现这个唯一序列呢?

一般来说,这个唯一序号有如下几种特征:

  • 全局唯一性:确保生成的序列是全局唯一的,不可重复。
  • 有序性:确保生成的ID值对于某个用户或者业务是按一定的数字有序递增的。
  • 高可用性:确保生成ID功能的高可用,能够承接较大峰值,能够保证序列生成的有效性(不重复且有序)。
  • 带时间标记:ID中有时间片段组成,可是清晰识别出操作的时间。

下面是业内几种常见的分布式唯一序列生成方案,我们一一来介绍下。

2 数据库自增

数据库主键设置自增序号 auto_increment,可以按照一定的趋势自增,保证主键ID的唯一性。

这个方案简单易操作,优点是明显、可控。

但由于它是在数据库的单表上进行操作,对数据库性能依赖比较明显,高并发下的压力也很大。所以不是唯一ID生成的最佳方法。

1 create table `t_generator_id`
2 (
3 `id` bigint(20) not null auto_increment,  -- 表示自增列
4  -- 其他字段信息
5 )

3 系统时间毫秒数

我们可以使用当前系统时间精确到毫秒数(或者时间戳)+业务属性+用户属性+随机数+...等参数组合形式来确保ID的唯一性,缺点是ID的有序性难以保证,如果对有序性由强需求的业务不建议使用。

类似京东淘宝等电商的订单号生成。因为订单号和用户id在业务上的区别,订单号尽可能要多些冗余的业务信息,比如

滴滴:时间+起点编号+车牌号 ; 淘宝订单:时间戳+用户ID,类似滴滴订单的唯一序号如下:

4 UUID(GUID)

Java自带的生成UUID的方式(.Net体系下也有GUID可以对应),生成的是Length=32的16进制格式的字符串,如果回退为byte数组共16个byte元素,即UUID是一个128bit长的数字,一般用16进制表示。

可以保证唯一性,但缺点是它不包含时间标识、业务数据可读性太差了,而且也不能ID的有序递增。优点生成方式,简单,高效,一般业务系统中比较少用。

5 批量预生成ID

1、在内存(缓存)中,按需批量生成N个ID,并将最大ID值记录到数据库中。比如生成 1~10000,把max=10000持久化到数据库中,内存中记录的是current=1和max=10000。

2、所有的使用都在内存中进行,每消耗一次序号,current + 1。

3、当current==max的时候,重复第一个步骤,再次批量生成 10001~20000的值,并将数据库中的max改成20000。

优点是避免了每次生成ID都要访问数据库并带来压力。

缺点是只能是单点服务,如果服务重启势必会造成ID丢失不连续的情况,而且这种方式也不利于水平扩展。

6 Redis生成唯一序列

Redis可以使用简易的String类型,它的 incr/decr key 语法,支持高效快速的增减值,能够保证生成的ID肯定是唯一有序的。

这种方式不依赖数据库持久化,速度快,算是比较好的办法了。但系统中引入Redis这一中间件,无形中增加维护成本。在超大流量、超高并发的情况下,单实例Redis还是无法满足的,需要横向扩展Redis集群来进行支撑。

1 <strong>incr</strong>/<strong>decr key</strong> // 自增减 1
2 <strong>incrby</strong>/<strong>decrby key</strong> increment  // 自增减指定数值
3 <strong>incrbyfloat</strong>/<strong>decrbyfloat key</strong> increment  // 自增减浮点数

还可以利用像Zookeeper中的znode数据版本来生成序列号,及MongoDB的ObjectId等,但是性能不如Redis,不是很推荐。

7 snowflake算法

Twitter在把存储系统从MySQL迁移到Cassandra的过程中由于Cassandra没有顺序ID生成机制,于是自己开发了一套全局唯一ID生成服务:Snowflake。

如上图的所示,Twitter的snowflake算法下面几部分组成:

  • 41位的时间序列,精确到毫秒,可以使用69年
  • 10位的机器标识,最多支持部署1024个节点
  • 12位的序列号,支持每个节点每毫秒产生4096个ID序号,最高位是符号位始终为0。

这种方案性能好,在单机上是递增的,但是由于涉及到分布式环境,每台机器上的时钟不可能完全同步,也许有时候也会出现不是全局递增的情况。

而且这个项目在2010就停止维护了,但这个设计思路被很多厂家参考,应用于各个业务的ID生成器及变种。

8 UidGenerator

UidGenerator是百度开源的一款分布式高性能的唯一ID生成器,使用Java实现的, 基于Snowflake算法的唯一ID生成器。

在实现上, UidGenerator通过借用未来时间来解决sequence天然存在的并发限制; 采用RingBuffer来缓存已生成的UID, 并行化UID的生产和消费, 同时对CacheLine补齐,避免了由RingBuffer带来的硬件级「伪共享」问题. 最终单机QPS可达600万。

具体的GitHub地址如下:

https://github.com/baidu/uid-generator/blob/master/README.zh_cn.md

9 Leaf

Leaf是美团开源的分布式ID生成器,能保证全局唯一性、趋势递增、单调递增、信息安全,同时也需要依赖关系数据库、Zookeeper等中间件。

美团技术社区有详细的说明,同时也对分布式ID生成有一些比较好的分析和建议:https://www.jb51.net/article/235968.htm

10 总结

个人觉得最好的是Redis方案和snowflake算法,无论是性能还是可用性程度上。另外各大厂也有自己的一些做法,比如百度的UidGenerator 和 美团的Leaf,

主要也是根据现有的方案进行优化和改造,达到比较契合他们自己业务的目标。

以上就是交互分布式系统下如何生成唯一序列的详细内容,更多关于交互分布式系统下的唯一序列的资料请关注我们其它相关文章!

(0)

相关推荐

  • 浅谈JAVA如何生成UUID唯一标识

    1.UUID 简介 UUID 含义是通用唯一识别码 (Universally Unique Identifier),这是一个软件建构的标准. 也是被开源软件基金会 (Open Software Foundation, OSF)的组织应用在分布式计算环境 (Distributed Computing Environment, DCE) 领域的一部分. UUID 的目的,是让分布式系统中的所有元素,都能有唯一的辨识资讯,而不需要透过中央控制端来做辨识资讯的指定. 如此一来,每个人都可以建立不与其它人

  • 分布式锁三种实现方式及对比

    分布式锁三种实现方式: 1. 基于数据库实现分布式锁: 2. 基于缓存(Redis等)实现分布式锁: 3. 基于Zookeeper实现分布式锁: 一, 基于数据库实现分布式锁 1. 悲观锁 利用select - where - for update 排他锁 注意: 其他附加功能与实现一基本一致,这里需要注意的是"where name=lock ",name字段必须要走索引,否则会锁表.有些情况下,比如表不大,mysql优化器会不走这个索引,导致锁表问题. 2. 乐观锁 所谓乐观锁与前边

  • 使用redis生成唯一编号及原理示例详解

    在系统开发中,保证数据的唯一性是至关重要的一件事,目前开发中常用的方式有使用数据库的自增序列.UUID生成唯一编号.时间戳或者时间戳+随机数等. 在某些特定业务场景中,可能会要求我们使用特定格式的唯一编号,比如我有一张订单表(t_order),我需要生成"yewu(ORDER)+日期(yyyyMMdd)+序列号(00000000)"格式的订单编号,比如今天的日期是20200716,那我今天第一个订单号就是ORDER2020071600000001.第二个订单号就是ORDER202007

  • Java实现Twitter的分布式自增ID算法snowflake

    概述 分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的. 有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成. 而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移到Cassandra,因为Cassandra没有顺序ID生成机制,所以开发了这样一套全局唯一ID生成服务. 结构 snowflake的结构如下(每部分用

  • Java中生成唯一ID的方法示例

    有时我们不依赖于数据库中自动递增的字段产生唯一ID,比如多表同一字段需要统一一个唯一ID,这时就需要用程序来生成一个唯一的全局ID. UUID 从Java 5开始, UUID 类提供了一种生成唯一ID的简单方法.UUID是通用唯一识别码 (Universally Unique Identifier)的缩写,UUID来源于OSF(Open Software Foundation,开源软件基金会)的DCE(Distributed Computing Environment,分布式计算环境)规范.UU

  • Redis实现分布式锁和等待序列的方法示例

    在集群下,经常会因为同时处理发生资源争抢和并发问题,但是我们都知道同步锁 synchronized . cas . ReentrankLock 这些锁的作用范围都是 JVM ,说白了在集群下没啥用.这时我们就需要能在多台 JVM 之间决定执行顺序的锁了,现在分布式锁主要有 redis . Zookeeper 实现的,还有数据库的方式,不过性能太差,也就是需要一个第三方的监管. 背景 最近在做一个消费 Kafka 消息的时候发现,由于线上的消费者过多,经常会遇到,多个机器同时处理一个主键类型的数据

  • 交互分布式系统下如何生成唯一序列

    目录 1 介绍 2 数据库自增 3 系统时间毫秒数 4 UUID(GUID) 5 批量预生成ID 6 Redis生成唯一序列 7 snowflake算法 8 UidGenerator 9 Leaf 10 总结 1 介绍 在常见的业务场景中,比如全局订单Id,唯一标识的支付编号等,都需要这个来保证. 那生成ID都有哪些解决方案呢?特别是在复杂的分布式系统业务场景中,我们应该采用哪种解决方案来实现这个唯一序列呢? 一般来说,这个唯一序号有如下几种特征: 全局唯一性:确保生成的序列是全局唯一的,不可重

  • java web在高并发和分布式下实现订单号生成唯一的解决方案

    方案一: 如果没有并发,订单号只在一个线程内产生,那么由于程序是顺序执行的,不同订单的生成时间戳正常不同,因此用时间戳+随机数(或自增数)就可以区分各个订单.如果存在并发,且订单号是由一个进程中的多个线程产生的,那么只要把线程ID添加到序列号中就可以保证订单号唯一.如果存在并发,且订单号是由同一台主机中的多个进程产生的,那么只要把进程ID添加到序列号中就可以保证订单号唯一.如果存在并发,且订单号是由不同台主机产生的,那么MAC地址.IP地址或CPU序列号等能够区分主机的号码添加到序列号中就可以保

  • 浅谈Java生成唯一标识码的三种方式

    目录 前言 正文 UUID实现唯一标识码 SnowFlake实现唯一标识码 通过时间工具生成带有业务标示的唯一标识码 前言 我们经常会遇到这样的场景,需要生成一个唯一的序列号来表明某一个数据的唯一性,在单节点的应用中我们可以简单地使用一个自增的整型来实现实现,但是在分布式情况下这个方式却存在冲突的可能性,那么有什么办法我们可以生成一个唯一的序列号呢,并且如果想使得这个序列号也能展示一些业务信息呢? 正文 UUID实现唯一标识码 UUID 的目的是让分布式系统中的所有元素,都能有唯一的辨识资讯,而

  • C#生成唯一值的方法汇总

    生成唯一值的方法很多,下面就不同环境下生成的唯一标识方法一一介绍,作为工作中的一次总结,有兴趣的可以自行测试: 一.在 .NET 中生成 1.直接用.NET Framework 提供的 Guid() 函数,此种方法使用非常广泛.GUID(全局统一标识符)是指在一台机器上生成的数字,它保证对在同一时空中的任何两台计算机都不会生成重复的 GUID 值(即保证所有机器都是唯一的).关于GUID的介绍在此不作具体熬述,想深入了解可以自行查阅MSDN.代码如下: 复制代码 代码如下: using Syst

  • Odoo中如何生成唯一不重复的序列号详解

    前言 最近在做的项目中有一个需求是要让某个字段值根据记录产生的日期和一定的组合规则按顺序生成一个序列号,这个序列号不可重复,这原本是一个很常见的需求,没有多想就写好了.由于没有考虑到并发的情况,到后面测试的时候才发现一个比较严重的问题,如果用户同时操作产生的记录,生成的序列号会出现重复. 经过讨论和思考后有几种解决方案,一是在数据库表层加锁,一是采用类似 redis 的消息队列,还有就是通过文件锁达到数据库排他锁的目的,鉴于时间和项目当前的情况,最后采用了通过文件锁实现这个需求. 其实除了以上几

  • 分布式系统下调用链追踪技术面试题

    引言 一个复杂的分布式系统,用户发起一个请求,这个请求可能调用几十到几百个服务,经过很多业务层,而每个业务又是多个机器集群,一个请求具体被随机到哪台机器上又无法确定,如果最后用户的请求失败,只返回一个错误提示,作为开发人员,该如何定位解决问题?你需要定位以下问题: 问题出在哪个服务,是你负责的服务还是调用别人服务的某一个环节. 同一个服务集群有多台机器,到底要去哪个机房哪台机器定位某条报错信息. 同一个接口可能有多次请求,到底是哪一次报错了. 多个服务之间调用顺序是怎样的. 如果需要响应速度优化

  • php生成唯一uid的解决方法详解

    目录 一.生成唯一uuid 二.生成唯一uid 三.生成唯一uid的正确方法 补充 一.生成唯一uuid 看到某些人会用uuid去代替用户的uid 从代码中可以看出,通过unique生成一个以毫秒级时间戳为前缀的字符后md5加密 再通过分隔符进行分割后得到uuid 这种方式虽然极大程度的避免了uid的重复 但是生成的uid太长,足足36个字符,而且是混杂英文和数字符号的,可读性很差 而一般的uid中都是纯数值组成的 <?php function generateUUid($strtoupper

  • Python标准库uuid模块(生成唯一标识)详解

    目录 UUID格式组成 Python 中的uuid 模块 uuid1() 中的getnode() UUID实际应用 UUID 的劣势 参考资料: 总结 UUID (Universally Unique Identifier,通用唯一标识)是一个128位的用于计算机系统中以识别信息的数目,虽然生成UUID的概率不为零,但是无限接近零,因此可以忽略不记,如此一来,每个人都可以建立不与其他人冲突的UUID. UUID格式组成 规范的文本中,UUID的十六个八位字节标识位32个十六进制(基数16)数字,

随机推荐