概述

分布式系统中，有一些需要使用全局唯一ID的场景，这种时候为了防止ID冲突可以使用36位的UUID，但是UUID有一些缺点，首先他相对比较长，另外UUID一般是无序的。

有些时候我们希望能使用一种简单一些的ID，并且希望ID能够按照时间有序生成。

而TWitter的snowflake解决了这种需求，最初TWitter把存储系统从MySQL迁移到Cassandra，因为Cassandra没有顺序ID生成机制，所以开发了这样一套全局唯一ID生成服务。

结构

snowflake的结构如下(每部分用-分开):

0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000

第一位为未使用，接下来的41位为毫秒级时间(41位的长度可以使用69年)，然后是5位datacenterId和5位workerId(10位的长度最多支持部署1024个节点），最后12位是毫秒内的计数（12位的计数顺序号支持每个节点每毫秒产生4096个ID序号）一共加起来刚好64位，为一个Long型。(转换成字符串后长度最多19)。

Snowflake生成的ID整体上按照时间自增排序，并且整个分布式系统内不会产生ID碰撞（由datacenter和workerId作区分），并且效率较高。经测试snowflake每秒能够产生409.6万个ID。

在 Ubuntu 18.04 下运行的截图：

源码

{ *

  * Twitter_Snowflake https://github.com/twitter-archive/snowflake

  * SnowFlake的结构如下(每部分用-分开):

  * 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000

  * 1位标识，由于long基本类型在Java中是带符号的，最高位是符号位，正数是0，负数是1，所以id一般是正数，最高位是0

  * 41位时间截(毫秒级)，注意，41位时间截不是存储当前时间的时间截，而是存储时间截的差值（当前时间截 - 开始时间截)

  * 得到的值），这里的的开始时间截，一般是我们的id生成器开始使用的时间，由我们程序来指定的（如下下面程序IdWorker类的startTime属性）。41位的时间截，可以使用69年，年T = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69

  * 10位的数据机器位，可以部署在1024个节点，包括5位datacenterId和5位workerId

  * 12位序列，毫秒内的计数，12位的计数顺序号支持每个节点每毫秒(同一机器，同一时间截)产生4096个ID序号

  * 加起来刚好64位，为一个Long型。

  * SnowFlake的优点是，整体上按照时间自增排序，并且整个分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作区分)，并且效率较高，经测试，SnowFlake每秒能够产生409.6万ID左右。

  *

  * 本算法参考官方 Twitter Snowflake 修改而来，同时借鉴了网上Java语言的版本。

  * 作者：全能中间件 64445322 https://www.centmap.cn/server

  * 使用方法：var OrderId := IdGenerator.NextId()，IdGenerator 不用创建也不用释放，而且该方法是线程安全的。

  * }

// 参考美团点评分布式ID生成系统

// https://tech.meituan.com/2017/04/21/mt-leaf.html

// https://github.com/Meituan-Dianping/Leaf/blob/master/leaf-core/src/main/java/com/sankuai/inf/leaf/snowflake/SnowflakeIDGenImpl.java

unit Snowflake;

interface

uses

  System.SysUtils, System.SyncObjs;

type

  TSnowflakeIdWorker = class(TObject)

  private const

    // 最大可用69年

    MaxYears = ;

    // 机器id所占的位数

    WorkerIdBits = ;

    // 数据标识id所占的位数

    DatacenterIdBits = ;

    // 序列在id中占的位数

    SequenceBits = ;

    // 机器ID向左移12位

    WorkerIdShift = SequenceBits;

    // 数据标识id向左移17位(12+5)

    DatacenterIdShift = SequenceBits + WorkerIdBits;

    // 时间截向左移22位(5+5+12)

    TimestampLeftShift = SequenceBits + WorkerIdBits + DatacenterIdBits;

{$WARNINGS OFF}

    // 生成序列的掩码，这里为4095 (0b111111111111=0xfff=4095)

    SequenceMask = - xor (- shl SequenceBits);

    // 支持的最大机器id

    MaxWorkerId = - xor (- shl WorkerIdBits);

    // 支持的最大数据标识id，结果是 31

    MaxDatacenterId = - xor (- shl DatacenterIdBits);

{$WARNINGS ON}

  private type

    TWorkerID =  .. MaxWorkerId;

    TDatacenterId =  .. MaxDatacenterId;

  strict private

    FWorkerID: TWorkerID;

    FDatacenterId: TDatacenterId;

    FEpoch: Int64;

    FSequence: Int64;

    FLastTimeStamp: Int64;

    FStartTimeStamp: Int64;

    FUnixTimestamp: Int64;

    FIsHighResolution: Boolean;

    /// <summary>

    /// 阻塞到下一个毫秒，直到获得新的时间戳

    /// </summary>

    /// <param name="ATimestamp ">上次生成ID的时间截</param>

    /// <returns>当前时间戳 </returns>

    function WaitUntilNextTime(ATimestamp: Int64): Int64;

    /// <summary>

    /// 返回以毫秒为单位的当前时间

    /// </summary>

    /// <remarks>

    /// 时间的表达格式为当前计算机时间和1970年1月1号0时0分0秒所差的毫秒数

    /// </remarks>

    function CurrentMilliseconds: Int64; inline;

    function CurrentTimeStamp: Int64; inline;

    function ElapsedMilliseconds: Int64; inline;

  private

    class var FLock: TSpinLock;

    class var FInstance: TSnowflakeIdWorker;

    class function GetInstance: TSnowflakeIdWorker; static;

    class constructor Create;

    class destructor Destroy;

  protected

    function GetEpoch: TDateTime;

    procedure SetEpoch(const Value: TDateTime);

  public

    constructor Create; overload;

    /// <summary>

    /// 获得下一个ID (该方法是线程安全的)

    /// </summary>

    function NextId: Int64;inline;

    /// <summary>

    /// 工作机器ID(0~31)

    /// </summary>

    property WorkerID: TWorkerID read FWorkerID write FWorkerID;

    /// <summary>

    /// 数据中心ID(0~31)

    /// </summary>

    property DatacenterId: TDatacenterId read FDatacenterId write FDatacenterId;

    /// <summary>

    /// 开始时间

    /// </summary>

    property Epoch: TDateTime read GetEpoch write SetEpoch;

    class property Instance: TSnowflakeIdWorker read GetInstance;

  end;

function IdGenerator: TSnowflakeIdWorker;

const

  ERROR_CLOCK_MOVED_BACKWARDS = 'Clock moved backwards. Refusing to generate id for %d milliseconds';

  ERROR_EPOCH_INVALID         = 'Epoch can not be greater than current';

implementation

uses

  System.Math, System.TimeSpan

{$IF defined(MSWINDOWS)}

    , Winapi.Windows

{$ELSEIF defined(MACOS)}

    , Macapi.Mach

{$ELSEIF defined(POSIX)}

    , Posix.Time

{$ENDIF}

    , System.DateUtils;

function IdGenerator: TSnowflakeIdWorker;

begin

  Result := TSnowflakeIdWorker.GetInstance;

end;

{ TSnowflakeIdWorker }

constructor TSnowflakeIdWorker.Create;

{$IF defined(MSWINDOWS)}

var

  Frequency: Int64;

{$ENDIF}

begin

  inherited;

{$IF defined(MSWINDOWS)}

  FIsHighResolution := QueryPerformanceFrequency(Frequency);

{$ELSEIF defined(POSIX)}

  FIsHighResolution := True;

{$ENDIF}

  FSequence := ;

  FWorkerID := ;

  FDatacenterId := ;

  FLastTimeStamp := -;

  FEpoch := DateTimeToUnix(EncodeDate(, , ), True) * MSecsPerSec;

  FUnixTimestamp := DateTimeToUnix(Now, True) * MSecsPerSec;

  FStartTimeStamp := CurrentTimeStamp;

end;

class destructor TSnowflakeIdWorker.Destroy;

begin

  FreeAndNil(FInstance);

end;

class constructor TSnowflakeIdWorker.Create;

begin

  FInstance := nil;

  FLock := TSpinLock.Create(False);

end;

class function TSnowflakeIdWorker.GetInstance: TSnowflakeIdWorker;

begin

  FLock.Enter;

  try

    if FInstance = nil then

      FInstance := TSnowflakeIdWorker.Create;

    Result := FInstance;

  finally

    FLock.Exit;

  end;

end;

function TSnowflakeIdWorker.CurrentTimeStamp: Int64;

{$IF defined(POSIX) and not defined(MACOS)}

var

  res: timespec;

{$ENDIF}

begin

{$IF defined(MSWINDOWS)}

  if FIsHighResolution then

    QueryPerformanceCounter(Result)

  else

    Result := GetTickCount * Int64(TTimeSpan.TicksPerMillisecond);

{$ELSEIF defined(MACOS)}

  Result := Int64(AbsoluteToNanoseconds(mach_absolute_time) div );

{$ELSEIF defined(POSIX)}

  clock_gettime(CLOCK_MONOTONIC, @res);

  Result := (Int64() * res.tv_sec + res.tv_nsec) div ;

{$ENDIF}

end;

function TSnowflakeIdWorker.ElapsedMilliseconds: Int64;

begin

  Result := (CurrentTimeStamp - FStartTimeStamp) div TTimeSpan.TicksPerMillisecond;

end;

function TSnowflakeIdWorker.GetEpoch: TDateTime;

begin

  Result := UnixToDateTime(FEpoch div MSecsPerSec, True);

end;

function TSnowflakeIdWorker.NextId: Int64;

var

  Offset: Integer;

  Timestamp: Int64;

begin

  FLock.Enter;

  try

    Timestamp := CurrentMilliseconds();

    // 如果当前时间小于上一次ID生成的时间戳，说明系统时钟回退过这个时候应当抛出异常

    if (Timestamp < FLastTimeStamp) then

    begin

      Offset := FLastTimeStamp - Timestamp;

      if Offset <=  then

      begin

        // 时间偏差大小小于5ms，则等待两倍时间

        System.SysUtils.Sleep(Offset shr );

        Timestamp := CurrentMilliseconds();

        // 还是小于，抛异常并上报

        if Timestamp < FLastTimeStamp then

          raise Exception.CreateFmt(ERROR_CLOCK_MOVED_BACKWARDS, [FLastTimeStamp - Timestamp]);

      end;

    end;

    // 如果是同一时间生成的，则进行毫秒内序列

    if (FLastTimeStamp = Timestamp) then

    begin

      FSequence := (FSequence + ) and SequenceMask;

      // 毫秒内序列溢出

      if (FSequence = ) then

        // 阻塞到下一个毫秒,获得新的时间戳

        Timestamp := WaitUntilNextTime(FLastTimeStamp);

    end

    // 时间戳改变，毫秒内序列重置

    else

      FSequence := ;

    // 上次生成ID的时间截

    FLastTimeStamp := Timestamp;

    // 移位并通过或运算拼到一起组成64位的ID

    Result := ((Timestamp - FEpoch) shl TimestampLeftShift)

      or (DatacenterId shl DatacenterIdShift)

      or (WorkerID shl WorkerIdShift)

      or FSequence;

  finally

    FLock.Exit;

  end;

end;

function TSnowflakeIdWorker.WaitUntilNextTime(ATimestamp: Int64): Int64;

var

  Timestamp: Int64;

begin

  Timestamp := CurrentMilliseconds();

  while Timestamp <= ATimestamp do

    Timestamp := CurrentMilliseconds();

  Result := Timestamp;

end;

procedure TSnowflakeIdWorker.SetEpoch(const Value: TDateTime);

begin

  if Value > Now then

    raise Exception.Create(ERROR_EPOCH_INVALID);

  if YearsBetween(Now, Value) <= MaxYears then

    FEpoch := DateTimeToUnix(Value, True) * MSecsPerSec;

end;

function TSnowflakeIdWorker.CurrentMilliseconds: Int64;

begin

  Result := FUnixTimestamp + ElapsedMilliseconds;

end;

end.

一秒可生成500万ID的分布式自增ID算法—雪花算法 (Snowflake，Delphi 版)的更多相关文章

分布式唯一ID生成算法-雪花算法
在我们的工作中,数据库某些表的字段会用到唯一的,趋势递增的订单编号,我们将介绍两种方法,一种是传统的采用随机数生成的方式,另外一种是采用当前比较流行的“分布式唯一ID生成算法-雪花算法”来实现. 一. ...
Twitter分布式自增ID算法snowflake原理解析
以JAVA为例 Twitter分布式自增ID算法snowflake,生成的是Long类型的id,一个Long类型占8个字节,每个字节占8比特,也就是说一个Long类型占64个比特(0和1). 那么一个 ...
Twitter分布式自增ID算法snowflake原理解析(Long类型)
Twitter分布式自增ID算法snowflake,生成的是Long类型的id,一个Long类型占8个字节,每个字节占8比特,也就是说一个Long类型占64个比特(0和1). 那么一个Long类型的6 ...
详解Twitter开源分布式自增ID算法snowflake(附演算验证过程)
详解Twitter开源分布式自增ID算法snowflake,附演算验证过程 2017年01月22日 14:44:40 url: http://blog.csdn.net/li396864285/art ...
分布式自增ID算法-Snowflake详解
1.Snowflake简介互联网快速发展的今天,分布式应用系统已经见怪不怪,在分布式系统中,我们需要各种各样的ID,既然是ID那么必然是要保证全局唯一,除此之外,不同当业务还需要不同的特性,比如像并 ...
Spring - jdbcTemplate - 调试代码: PreparedStatementCreator 生成的语句, update 之后没有自增id, 已解决
1. 概述解决 jdbcTemplate 下, update 结果不带自增id 的问题 2. 场景看书 Spring in Action 5th 3.1.4 listing 3.10 saveT ...
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的. 有些时候我们希望能使用一种 ...
Twitter的分布式自增ID算法snowflake（雪花算法） - C#版
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的.有些时候我们希望能使用一种简 ...
分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的. 有些时候我们希望能使用一种 ...

随机推荐

git crate patch and check&apply patch（八）
root@vmuer-VirtualBox:/opt/myProject# git format-patch master0001-add-c.c.patch root@vmuer-VirtualBo ...
用Matlab证明三维勾股定理
证明代码: syms a b c ; ab=sqrt(a^+b^); bc=sqrt(c^+b^); ca=sqrt(c^+a^); p=(ab+bc+ca)/; s1=(p*(p-ab)*(p-bc ...
kafka部署在云服务器(centOS 6.5),本地远程连接问题
kafka简介 Apache Kafka发源于LinkedIn,于2011年成为Apache的孵化项目,随后于2012年成为Apache的主要项目之一.Kafka使用Scala和Java进行编写.Ap ...
ffmpeg结合SDL编写播放器（三）
接下来是解析影片的帧 /*** project.c ***/ #include<stdio.h> #include<libavcodec/avcodec.h> #include ...
ubuntu下Java通过JNI调用C
下面看一个实例,如下: public class TestJNI { static { System.loadLibrary("diaoyong"); // 程序在加载时,自动加载 ...
JDBC PreparedStatement Statement
参考:预编译语句(Prepared Statements)介绍,以MySQL为例 1. 背景本文重点讲述MySQL中的预编译语句并从MySQL的Connector/J源码出发讲述其在Java语言中相 ...
mysql中的正则操作匹配手机号，匹配中文，替换
mysql中的正则操作匹配手机号,匹配中文,替换正则匹配hy_user表内tel字段的电话号码: SELECT * FROM hy_user WHERE tel REGEXP "[1][ ...
[python]pypy优化python性能
下载地址:https://pypy.org/download.html # python2.7版本 yum install pypy # python3.6版本https://bitbucket.or ...
linux系统错误码大全
#define EPERM 1 /* Operation not permitted */ #define ENOENT 2 /* No such file or directory */ #defi ...
解决pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path问题
解决方案: 找到python的安装路径下的pytesseract: 例如我的是 C:\develop\Python\Lib\site-packages\pytesseract .用文本编辑器打开 ...

一秒可生成500万ID的分布式自增ID算法—雪花算法 (Snowflake，Delphi 版)

概述

结构

源码

一秒可生成500万ID的分布式自增ID算法—雪花算法 (Snowflake，Delphi 版)的更多相关文章

随机推荐

热门专题