分布式全局ID生成器设计

项目是分布式的架构，需要设计一款分布式全局ID，参照了多种方案，最后基于snowflake的算法设计了一款自用ID生成器。具有以下优势：

保证分布式场景下生成的ID是全局唯一的

生成的全局ID整体上是呈自增趋势的，也就是说整体是粗略有序的

高性能，能快速产生ID，本机(I7-6400HQ)单线程可以达到每秒生成近40万个ID

只占64bit位空间，可以根据业务需求扩展在前缀或后缀拼接业务标志位转化为字符串。

UUID方案

UUID：UUID长度128bit，32个16进制字符，占用存储空间多，且生成的ID是无序的
对于InnoDB这种聚集主键类型的引擎来说，数据会按照主键进行排序，由于UUID的无序性，InnoDB会产生巨大的IO压力，此时不适合使用UUID做物理主键，可以把它作为逻辑主键，物理主键依然使用自增ID。
组成部分：当前日期和时间、时钟序列、机器识别码

数据库生成全局ID方案

结合数据库维护一个Sequence表，每当需要为某个表的新纪录生成ID时就从Sequence表中取出对应的nextid,将其+1后更新到数据库中以备下次使用。
由于所有的插入都要访问该表，很容易造成性能瓶颈，且存在单点问题，如果该表所在的数据库失效，全部应用无法工作。
在高并发场景下，无法保证高性能。

snowflake方案

是一个优秀的分布式Id生成方案，是Scala实现的，此次项目就是基于snowflake算法基础上设计的Java优化版

1位，不用。二进制中最高位为1的都是负数，但是我们生成的id一般都使用整数，所以这个最高位固定是0
41位，用来记录时间戳（毫秒），41位可以表示2⁴¹−1个数字，也就是说41位可以表示2⁴¹−1个毫秒的值，转化成单位年则是(2^41−1)/(1000∗60∗60∗24∗365)=69年
10位，用来记录工作机器id。可以部署在2¹⁰=1024个节点，包括5位datacenterId和5位workerId,5位（bit）可以表示的最最大正整数是2^5−1=31，即可以用0、1、2、3、....31这32个数字，来表示不同的datecenterId或workerId
12位，序列号，用来记录同毫秒内产生的不同id。12位（bit）可以表示的最大正整数是2¹²−1=4095，即可以用0、1、2、3、....4095这4096个数字，来表示同一机器同一时间截（毫秒)内产生的4096个ID序号

改进方案

全局唯一ID生成结构如下(每部分用-分开):

0 - 00 - 0000000000 0000000000 0000000000 0000000000 0 - 0000000000 00 - 00000000
1位标识，由于long基本类型在Java中是带符号的，最高位是符号位，正数是0，负数是1，所以id一般是正数，最高位是0
2位生成发布方式，0代表嵌入式发布、1代表中心服务器发布模式、2代表rest发布方式、3代表测试方式
41位时间截(毫秒级)，注意，41位时间截不是存储当前时间的时间截，而是存储时间截的差值（当前时间截 - 开始时间截得到的值），这里的的开始时间截，一般是我们的id生成器开始使用的时间，由我们程序来指定的。41位的时间截，可以使用69年，年T = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69
12位序列，毫秒内的计数，12位的计数顺序号支持每个节点每毫秒(同一机器，同一时间截)产生4096个ID序号
8位的数据机器位，可以部署在256个节点，包括8位workerId
加起来刚好64位，为一个Long型
优点是，整体上按照时间自增排序，并且整个分布式系统内不会产生ID碰撞(机器ID作区分)，并且效率较高，经本地测试每秒能够产生40万ID左右。

方案优势

保证分布式场景下生成的ID是全局唯一的
生成的全局ID整体上是呈自增趋势的，也就是说整体是粗略有序的
高性能，能快速产生ID，本机单线程可以达到每秒生成近40万个ID
只占64bit位空间，可以根据业务需求在前缀或后缀拼接业务标志位。

import java.util.concurrent.locks.Lock;

import java.util.concurrent.locks.ReentrantLock;

public final class IdGenerate {

    // ==============================Fields===========================================

    /** 开始时间截 (2018-01-01) */

    private final long twepoch = 1514736000000L;

    /** 机器id所占的位数 */

    private final long workerIdBits = 8L;

    /** 序列在id中占的位数 */

    private final long sequenceBits = 12L;

    /** 毫秒级别时间截占的位数 */

    private final long timestampBits = 41L;

    /** 生成发布方式所占的位数 */

    private final long getMethodBits = 2L;

    /** 支持的最大机器id，结果是255 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数) */

    private final long maxWorkerId = -1L ^ (-1L << workerIdBits);

    /** 生成序列向左移8位(8) */

    private final long sequenceShift = workerIdBits;

    /** 时间截向左移20位(12+8) */

    private final long timestampShift = sequenceBits + workerIdBits;

    /** 生成发布方式向左移61位(41+12+8) */

    private final long getMethodShift = timestampBits + sequenceBits  + workerIdBits;

    /** 工作机器ID(0~255) */

    private long workerId = 0L;

    /** 生成序列的掩码，这里为4095 (0b111111111111=0xfff=4095) */

    private final long sequenceMask = -1L ^ (-1L << sequenceBits);

    /** 毫秒内序列(0~4095) */

    private long sequence = 0L;

    /** 上次生成ID的时间截 */

    private long lastTimestamp = -1L;

    /** 2位生成发布方式，0代表嵌入式发布、1代表中心服务器发布模式、2代表rest发布方式、3代表保留未用 */

    private long getMethod = 0L;

    /** 成发布方式的掩码，这里为3 (0b11=0x3=3) */

    private long maxGetMethod = -1L ^ (-1L << getMethodBits);

    /** 重入锁*/

    private Lock lock = new ReentrantLock();

    //==============================Constructors=====================================

    /**

     * 构造函数

     * @param 发布方式 0代表嵌入式发布、1代表中心服务器发布模式、2代表rest发布方式、3代表保留未用 (0~3)

     * @param workerId 工作ID (0~255)

     */

    public IdGenerate(long getMethod, long workerId) {

        if (getMethod > maxGetMethod || getMethod < 0) {

            throw new IllegalArgumentException(String.format("getMethod can't be greater than %d or less than 0", maxGetMethod));

        }

        if (workerId > maxWorkerId || workerId < 0) {

            throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));

        }

        this.getMethod = getMethod;

        this.workerId = workerId;

    }

    public long[] nextId(int nums) {

        long[] ids = new long[nums];

        for (int i = 0; i < nums; i++) {

            ids[i] = nextId();

        }

        return ids;

    }

    // ==============================Methods==========================================

    /**

     * 获得下一个ID (该方法是线程安全的)

     * @return SnowflakeId

     */

    public long nextId() {

        long timestamp = timeGen();

        //如果当前时间小于上一次ID生成的时间戳，说明系统时钟回退过这个时候应当抛出异常

        if (timestamp < lastTimestamp) {

            throw new RuntimeException(

                    String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));

        }

        //如果是同一时间生成的，则进行毫秒内序列

        if (lastTimestamp == timestamp) {

            try {

                lock.lock();

                sequence = (sequence + 1) & sequenceMask;

                //毫秒内序列溢出

                if (sequence == 0) {

                    //阻塞到下一个毫秒,获得新的时间戳

                    timestamp = tilNextMillis(lastTimestamp);

                }

            }finally {

                lock.unlock();

            }

        }

        //时间戳改变，毫秒内序列重置

        else {

            sequence = 0L;

        }

        //上次生成ID的时间截

        lastTimestamp = timestamp;

        //移位并通过或运算拼到一起组成64位的ID

        return  (getMethod << getMethodShift) // 生成方式占用2位，左移61位

                | ((timestamp - twepoch) << timestampShift) // 时间差占用41位，最多69年，左移20位

                | (sequence << sequenceShift) // 毫秒内序列，取值范围0-4095

                | workerId; // 工作机器，取值范围0-255

    }

    public String nextString() {

        return Long.toString(nextId());

    }

    public String[] nextString(int nums) {

        String[] ids = new String[nums];

        for (int i = 0; i < nums; i++) {

            ids[i] = nextString();

        }

        return ids;

    }

    public String nextCode(String prefix) {

        StringBuilder sb = new StringBuilder(prefix);

        long id = nextId();

        sb.append(id);

        return sb.toString();

    }

    /**

     * 此方法可以在前缀上增加业务标志

     * @param prefix

     * @param nums

     * @return

     */

    public String[] nextCode(String prefix, int nums) {

        String[] ids = new String[nums];

        for (int i = 0; i < nums; i++) {

            ids[i] = nextCode(prefix);

        }

        return ids;

    }

    public String nextHexString() {

        return Long.toHexString(nextId());

    }

    /**

     * 阻塞到下一个毫秒，直到获得新的时间戳

     * @param lastTimestamp 上次生成ID的时间截

     * @return 当前时间戳

     */

    protected long tilNextMillis(long lastTimestamp) {

        long timestamp = timeGen();

        while (timestamp <= lastTimestamp) {

            timestamp = timeGen();

        }

        return timestamp;

    }

    /**

     * 返回以毫秒为单位的当前时间

     * @return 当前时间(毫秒)

     */

    protected long timeGen() {

        return System.currentTimeMillis();

    }

    //==============================Test=============================================

    /**

     * 测试

     *

     *

     */

    public static void main(String[] args) {

        IdGenerate idGenerate = new IdGenerate(0, 0);

        int count = 100000;//线程数=count*count

        final long[][] times = new long[count][100];

        Thread[] threads = new Thread[count];

        for (int i = 0; i < threads.length; i++) {

            final int ip = i;

            threads[i] = new Thread() {

                @Override

                public void run() {

                    for (int j = 0; j <100; j++) {

                        long t1 = System.nanoTime();//该函数是返回纳秒的。1毫秒=1纳秒*1000000

                        idGenerate.nextId();//测试

                        long t = System.nanoTime() - t1;

                        times[ip][j] = t;//求平均

                    }

                }

            };

        }

        long lastMilis = System.currentTimeMillis();

        //逐个启动线程

        for (int i = 0; i < threads.length; i++) {

            threads[i].start();

        }

        for (int i = 0; i < threads.length; i++) {

            try {

                threads[i].join();

            } catch (InterruptedException e) {

                e.printStackTrace();

            }

        }

        /**

         * 1、QPS：系统每秒处理的请求数（query per second）

           2、RT：系统的响应时间，一个请求的响应时间，也可以是一段时间的平均值

           3、最佳线程数量：刚好消耗完服务器瓶颈资源的临界线程数

            对于单线程：QPS=1000/RT

            对于多线程：QPS=1000*线程数量/RT

         */

        long time = System.currentTimeMillis() - lastMilis;

        System.out

                .println("QPS: "

                        + (1000*count /time));

        long sum = 0;

        long max = 0;

        for (int i = 0; i < times.length; i++) {

            for (int j = 0; j < times[i].length; j++) {

                sum += times[i][j];

                if (times[i][j] > max)

                    max = times[i][j];

            }

        }

        System.out.println("Sum(ms)"+time);

        System.out.println("AVG(ms): " + sum / 1000000 / (count*100));

        System.out.println("MAX(ms): " + max / 1000000);

    }

}

测试结果

环境：CPU 双核I7—6400HQ 系统win10

单线程下每秒产生近40万个全局ID

模拟单个服务器并发场景：

1000线程并发下每个线程产生100个ID，共生产10万个ID

QPS: 2610
Sum(ms)383
AVG(ms): 0
MAX(ms): 9

10000线程并发下每个线程产生100个ID，共生产100万个ID

QPS: 2701
Sum(ms)3701
AVG(ms): 0
MAX(ms): 9

50000线程并发下每个线程产生100个ID，共生产500万个ID

QPS: 2720
Sum(ms)18382
AVG(ms): 0
MAX(ms): 11

分布式全局ID生成器设计的更多相关文章

分布式全局ID生成器原理剖析及非常齐全开源方案应用示例
为何需要分布式ID生成器 **本人博客网站 **IT小神 www.itxiaoshen.com **拿我们系统常用Mysql数据库来说,在之前的单体架构基本是单库结构,每个业务表的ID一般从1增,通过 ...
snowflake 分布式唯一ID生成器
本文来自我的github pages博客http://galengao.github.io/ 即www.gaohuirong.cn 摘要: 原文参考运维生存和开源中国上的代码整理我的环境是pytho ...
分布式唯一id生成器的想法
0x01 起因前端时间遇到一个问题,怎么快速生成唯一的id,后来采用了hashid的方法.最近在网上读到了美团关于分布式唯一id生成器的解决方案, 其中提到了三种生成法:(建议看一下这篇文章,写得很 ...
分布式的Id生成器
项目中需要一个分布式的Id生成器,twitter的Snowflake中这个既简单又高效,网上找的Java版本 package com.cqfc.id; import org.slf4j.Logger; ...
Jedis使用总结【pipeline】【分布式的id生成器】【分布式锁【watch】【multi】】【redis分布式】(转)
前段时间细节的了解了Jedis的使用,Jedis是redis的java版本的客户端实现.本文做个总结,主要分享如下内容: [pipeline][分布式的id生成器][分布式锁[watch][multi ...
高并发情况下分布式全局ID
1.高并发情况下,生成分布式全局id策略2.利用全球唯一UUID生成订单号优缺点3.基于数据库自增或者序列生成订单号4.数据库集群如何考虑数据库自增唯一性5.基于Redis生成生成全局id策略6.Tw ...
分布式全局ID与分布式事务
1. 概述老话说的好:人不可貌相,海水不可斗量.以貌取人是非常不好的,我们要平等的对待每一个人. 言归正传,今天我们来聊一下分布式全局 ID 与分布式事务. 2. 分布式全局ID 2.1 分布式数据 ...
分布式全局ID生成方案
传统的单体架构的时候,我们基本是单库然后业务单表的结构.每个业务表的ID一般我们都是从1增,通过AUTO_INCREMENT=1设置自增起始值,但是在分布式服务架构模式下分库分表的设计,使得多个库或多 ...
分布式全局ID的几种生成方案
前言在互联网的业务系统中,涉及到各种各样的ID,如在支付系统中就会有支付ID.退款ID等. 那一般生成ID都有哪些解决方案呢?特别是在复杂的分布式系统业务场景中,我们应该采用哪种适合自己的解决方案是 ...

随机推荐

Quart2D setNeedsDisplay
#import "myview.h" @interface myview () @property(nonatomic,assign) float imageY; @end @im ...
python模块之xlwt
一. 安装 pip install xlwt 二. 使用 1. 创建excel(工作簿)对象 import xlwt wb = xlwt.Workbook() # 生成Workbook对象(xlwt. ...
sqlhelper中事务的简单用法
sql1="INSERT INTO tablename(Id,col1,col2) VALUES(@Id,@col1,@col2) update tablename2 set col=@co ...
C# Thread.Abort方法真的让线程停止了吗？
大家都知道在C#里面,我们可以使用 Thread.Start方法来启动一个线程,当我们想停止执行的线程时可以使用Thread.Abort方法来强制停止正在执行的线程,但是请注意,你确定调用了Threa ...
[javaSE] 看知乎学习反射
简单的来说,反射机制指的是程序在运行时能够获取自身的信息.在java中,只要给定类的名字,那么就可以通过反射机制来获得类的所有信息. 知乎:学习java应该如何理解反射? 余晖: 反射提供了一种运 ...
使用ajax请求SpringMVC返回Json出现乱码解决方法
1:在使用ajax请求后台访问数据的数据,后台返回的数据是乱码,带??问号的乱码,之前还一直没有遇到过,在这里记录整理一下,贴出解决代码! (1):前台使用ajax ,已经设定返回的结果为json格式 ...
JVM 堆内存和非堆内存
转载自:http://www.importnew.com/27645.html 堆和非堆内存按照官方的说法:“Java 虚拟机具有一个堆(Heap),堆是运行时数据区域,所有类实例和数组的内存均从此 ...
hadoop_完全分布式配置
注:此文章所写内容完全在虚拟机配置,系统:centos,jdk和hadoop已经安装完成所配集群包括hadoop01,hadoop02,hadoop03,hadoop04四台,ip分别为:192.16 ...
Donsen法则
“专才”对越来越少的事物了解得越来越多,直到最后他对不存在的事物无所不知: 然而,“通才”对越来越多的事物了解得越来越少,直到他对一切事物一无所知.
JS 闭包 p5
终于到闭包了,写了一晚上,好激动: 首先闭包,个人是这样理解的(比较好记):闭包是一种能力,是一种可以访问内部函数作用域的能力或者说是一种行使权力,一旦你拥有这个能力,你将可以访问内部函数的作用域.

分布式全局ID生成器设计

分布式全局ID生成器设计

UUID方案

数据库生成全局ID方案

snowflake方案

改进方案

方案优势

测试结果

模拟单个服务器并发场景：

1000线程并发下每个线程产生100个ID，共生产10万个ID

10000线程并发下每个线程产生100个ID，共生产100万个ID

50000线程并发下每个线程产生100个ID，共生产500万个ID

分布式全局ID生成器设计的更多相关文章

随机推荐

热门专题