分布式ID生成 - 雪花算法

雪花算法是一种生成分布式全局唯一ID的经典算法，关于雪花算法的解读网上多如牛毛，大多抄来抄去，这里请参考耕耘的小象大神的博客ID生成器，Twitter的雪花算法（Java）

网上的教程一般存在两个问题：

1. 机器ID（5位）和数据中心ID（5位）配置没有解决，分布式部署的时候会使用相同的配置，任然有ID重复的风险。

2. 使用的时候需要实例化对象，没有形成开箱即用的工具类。

本文针对上面两个问题进行解决，笔者的解决方案是，workId使用服务器hostName生成，dataCenterId使用IP生成，这样可以最大限度防止10位机器码重复，但是由于两个ID都不能超过32，只能取余数，还是难免产生重复，但是实际使用中，hostName和IP的配置一般连续或相近，只要不是刚好相隔32位，就不会有问题，况且，hostName和IP同时相隔32的情况更加是几乎不可能的事，平时做的分布式部署，一般也不会超过10台容器。

使用上面的方法可以零配置使用雪花算法，雪花算法10位机器码的设定理论上可以有1024个节点，生产上使用docker配置一般是一次编译，然后分布式部署到不同容器，不会有不同的配置，这里不知道其他公司是如何解决的，即使有方法使用一套配置，然后运行时根据不同容器读取不同的配置，但是给每个容器编配ID，1024个（大部分情况下没有这么多），似乎也不太可能，此问题留待日后解决后再行补充。

package com.feicent.util;

import org.apache.commons.lang3.RandomUtils;

import org.apache.commons.lang3.StringUtils;

import org.apache.commons.lang3.SystemUtils;

import java.net.Inet4Address;

import java.net.UnknownHostException;

/**

 * Twitter_Snowflake<br>

 * https://blog.csdn.net/u012488504/article/details/82194495

 * SnowFlake的结构如下(每部分用-分开):<br>

 * 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000 <br>

 * 1位标识，由于long基本类型在Java中是带符号的，最高位是符号位，正数是0，负数是1，所以id一般是正数，最高位是0<br>

 * 41位时间截(毫秒级)，注意，41位时间截不是存储当前时间的时间截，而是存储时间截的差值（当前时间截 - 开始时间截)

 * 得到的值），这里的的开始时间截，一般是我们的id生成器开始使用的时间，由我们程序来指定的（如下下面程序IdWorker类的startTime属性）。41位的时间截，可以使用69年，年T = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69<br>

 * 10位的数据机器位，可以部署在1024个节点，包括5位datacenterId和5位workerId<br>

 * 12位序列，毫秒内的计数，12位的计数顺序号支持每个节点每毫秒(同一机器，同一时间截)产生4096个ID序号<br>

 * 加起来刚好64位，为一个Long型。<br>

 * SnowFlake的优点是，整体上按照时间自增排序，并且整个分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作区分)，并且效率较高，经测试，SnowFlake每秒能够产生26万ID左右。

 */

public class SnowflakeIdWorker {

    // ==============================Fields===========================================

    /** 开始时间截 (2015-01-01) */

    private final long twepoch = 1489111610226L;

    /** 机器id所占的位数 */

    private final long workerIdBits = 5L;

    /** 数据标识id所占的位数 */

    private final long dataCenterIdBits = 5L;

    /** 支持的最大机器id，结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数) */

    private final long maxWorkerId = -1L ^ (-1L << workerIdBits);

    /** 支持的最大数据标识id，结果是31 */

    private final long maxDataCenterId = -1L ^ (-1L << dataCenterIdBits);

    /** 序列在id中占的位数 */

    private final long sequenceBits = 12L;

    /** 机器ID向左移12位 */

    private final long workerIdShift = sequenceBits;

    /** 数据标识id向左移17位(12+5) */

    private final long dataCenterIdShift = sequenceBits + workerIdBits;

    /** 时间截向左移22位(5+5+12) */

    private final long timestampLeftShift = sequenceBits + workerIdBits + dataCenterIdBits;

    /** 生成序列的掩码，这里为4095 (0b111111111111=0xfff=4095) */

    private final long sequenceMask = -1L ^ (-1L << sequenceBits);

    /** 工作机器ID(0~31) */

    private long workerId;

    /** 数据中心ID(0~31) */

    private long dataCenterId;

    /** 毫秒内序列(0~4095) */

    private long sequence = 0L;

    /** 上次生成ID的时间截 */

    private long lastTimestamp = -1L;

    private static SnowflakeIdWorker idWorker;

    static {

        long workerId = getWorkId();

        long dataCenterId = getDataCenterId();

        System.out.println("workerId = "+ workerId+ " , dataCenterId = "+ dataCenterId);

        idWorker = new SnowflakeIdWorker(workerId, dataCenterId);

    }

    //==============================Constructors=====================================

    /**

     * 构造函数

     * @param workerId 工作ID (0~31)

     * @param dataCenterId 数据中心ID (0~31)

     */

    public SnowflakeIdWorker(long workerId, long dataCenterId) {

        if (workerId > maxWorkerId || workerId < 0) {

            throw new IllegalArgumentException(String.format("workerId can't be greater than %d or less than 0", maxWorkerId));

        }

        if (dataCenterId > maxDataCenterId || dataCenterId < 0) {

            throw new IllegalArgumentException(String.format("dataCenterId can't be greater than %d or less than 0", maxDataCenterId));

        }

        this.workerId = workerId;

        this.dataCenterId = dataCenterId;

    }

    // ==============================Methods==========================================

    /**

     * 获得下一个ID (该方法是线程安全的)

     * @return SnowflakeId

     */

    public synchronized long nextId() {

        long timestamp = timeGen();

        //如果当前时间小于上一次ID生成的时间戳，说明系统时钟回退过这个时候应当抛出异常

        if (timestamp < lastTimestamp) {

            throw new RuntimeException(

                    String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));

        }

        //如果是同一时间生成的，则进行毫秒内序列

        if (lastTimestamp == timestamp) {

            sequence = (sequence + 1) & sequenceMask;

            //毫秒内序列溢出

            if (sequence == 0) {

                //阻塞到下一个毫秒,获得新的时间戳

                timestamp = tilNextMillis(lastTimestamp);

            }

        }

        //时间戳改变，毫秒内序列重置

        else {

            sequence = 0L;

        }

        //上次生成ID的时间截

        lastTimestamp = timestamp;

        //移位并通过或运算拼到一起组成64位的ID

        return ((timestamp - twepoch) << timestampLeftShift)

                | (dataCenterId << dataCenterIdShift)

                | (workerId << workerIdShift)

                | sequence;

    }

    /**

     * 阻塞到下一个毫秒，直到获得新的时间戳

     * @param lastTimestamp 上次生成ID的时间截

     * @return 当前时间戳

     */

    protected long tilNextMillis(long lastTimestamp) {

        long timestamp = timeGen();

        while (timestamp <= lastTimestamp) {

            timestamp = timeGen();

        }

        return timestamp;

    }

    /**

     * 返回以毫秒为单位的当前时间

     * @return 当前时间(毫秒)

     */

    protected long timeGen() {

        return System.currentTimeMillis();

    }

    private static long getWorkId(){

        try {

            String hostAddress = Inet4Address.getLocalHost().getHostAddress();

            System.out.println("hostAddress: " + hostAddress);

            int[] ints = StringUtils.toCodePoints(hostAddress);

            int sums = 0;

            for(int b : ints){

                sums += b;

            }

            return (long)(sums % 32);

        } catch (UnknownHostException e) {

            // 如果获取失败，则使用随机数备用

            return RandomUtils.nextLong(0, 32);

        }

    }

    private static long getDataCenterId(){

        System.out.println("hostName: " + SystemUtils.getHostName());

        int[] ints = StringUtils.toCodePoints(SystemUtils.getHostName());

        int sums = 0;

        for (int i: ints) {

            sums += i;

        }

        return (long)(sums % 32);

    }

    /**

     * 静态工具类

     *

     * @return

     */

    public static Long generateId(){

        return idWorker.nextId();

    }

    /** 测试 */

    public static void main(String[] args) {

        System.out.println(System.currentTimeMillis());

        long startTime = System.nanoTime();

        int count = 1000000;

        for (int i = 0; i < count; i++) {

            long id = SnowflakeIdWorker.generateId();

            //System.out.println(id);

        }

        System.out.println("生成["+count+ "]条ID共耗时：" +(System.nanoTime()-startTime)/1000000+"ms");

    }

}

分布式ID生成 - 雪花算法的更多相关文章

适用于分布式ID的雪花算法
基于Java实现的适用于分布式ID的雪花算法工具类,这里存一下日后好找 /** * 雪花算法生成ID */ public class SnowFlakeUtil { private final sta ...
ID生成雪花算法
/** * ID生成雪花算法 */ public class SnowFlake { public static SnowFlake getInstance() { return Singleton ...
分布式ID的雪花算法及坑
分布式ID生成是目前系统的常见刚需,其中以Twitter的雪花算法(Snowflake)比较知名,有Java等各种语言的版本及各种改进版本,能生成满足分布式ID,返回ID为Long长整数但是这里有一 ...
全局ID生成--雪花算法
分布式ID常见生成策略: 分布式ID生成策略常见的有如下几种: 数据库自增ID. UUID生成. Redis的原子自增方式. 数据库水平拆分,设置初始值和相同的自增步长. 批量申请自增ID. 雪花算法 ...
生成主键ID,唯一键id,分布式ID生成器雪花算法代码实现
工具类: package com.ihrm.common.utils; import java.lang.management.ManagementFactory; import java.net. ...
全局ID生成--雪花算法改进版
存在的问题时间回拨问题:由于机器的时间是动态的调整的,有可能会出现时间跑到之前几毫秒,如果这个时候获取到了这种时间,则会出现数据重复机器id分配及回收问题:目前机器id需要每台机器不一样,这样的方 ...
分布式ID生成系统 UUID与雪花（snowflake）算法
Leaf——美团点评分布式ID生成系统 -https://tech.meituan.com/MT_Leaf.html 网游服务器中的GUID(唯一标识码)实现-基于snowflake算法-云栖社区-阿 ...
理解分布式id生成算法SnowFlake
理解分布式id生成算法SnowFlake https://segmentfault.com/a/1190000011282426#articleHeader2 分布式id生成算法的有很多种,Twitt ...
美团技术分享：深度解密美团的分布式ID生成算法
本文来自美团技术团队“照东”的分享,原题<Leaf——美团点评分布式ID生成系统>,收录时有勘误.修订并重新排版,感谢原作者的分享. 1.引言鉴于IM系统中聊天消息ID生成算法和生成策略 ...

随机推荐

使用`html-webpack-plugin`插件配置启动页面
由于使用`--contentBase`指令的过程比较繁琐,需要指定启动的目录,同时还需要修改index.html中script标签的src属性,所以推荐大家使用`html-webpack-plugin ...
react搭建
https://juejin.im/post/5b4de4496fb9a04fc226a7af
Springboot 打jar包项目无法访问jsp问题解决方案
maven编译插件,请选择1.4.2.RELEASE版本,1.5.x的版本已经不再支持 pom.xml重要部分如下: <build> <resources> <resou ...
CentOS7 安装 Python3.6.5
在centos7下安装python3.6.5 CentOS7编译安装python3.6.8报错zipimport.ZipImportError: can't decompress data; zlib ...
牛客OI周赛11-普及组 B Game with numbers (数学，预处理真因子)
链接:https://ac.nowcoder.com/acm/contest/942/B 来源:牛客网 Game with numbers 时间限制:C/C++ 1秒,其他语言2秒空间限制:C/C+ ...
[易学易懂系列|golang语言|零基础|快速入门|（一）]
golang编程语言,是google推出的一门语言. 主要应用在系统编程和高性能服务器编程,有广大的市场前景,目前整个生态也越来越强大,未来可能在企业应用和人工智能等领域占有越来越重要的地位. 本文章 ...
1.docker容器技术基础入门
内容来自:https://www.cnblogs.com/marility/p/10215062.html https://blog.51cto.com/gouyc/2310785?source=dr ...
asp.net上传超大文件
HTML部分 <%@PageLanguage="C#"AutoEventWireup="true"CodeBehind="index.aspx. ...
Java——面向对象编程
在面向对象的编程中,不能再有第一步.第二步怎么做的概念. [对象和类]
洛谷 P2590 BZOJ 1036 [ZJOI2008]树的统计
Time limit 10000 ms//另外,BZOJ只算所有点的总时限,所以可能会放过一些原本会TLE的代码 Memory limit 165888 kB OS Linux SourceZJOI2 ...

分布式ID生成 - 雪花算法

分布式ID生成 - 雪花算法的更多相关文章

随机推荐

热门专题