[C#] 分布式ID自增算法 Snowflake
最近在尝试EF的多数据库移植,但是原始项目中主键用的Sqlserver的GUID。MySQL没法移植了。
其实发现GUID也没法保证数据的递增性,又不太想使用int递增主键,就开始探索别的ID形式。
后来发现twitter的Snowflake算法。
一开始我尝试过直接引用Nuget里的Snowflake的扩展包(有Framework版和Core版),不过有些Bug,就是初始化参数有的时候不一定好用,最大问题是,这个需要实例化对象,并且通过同一个对象来实生成ID,否则会出现ID冲突问题。而且,我们还要考虑对象在内存的生存问题。学习这种算法是够用了,但是用到实际生产中则有很多问题,虽然我们可以通过一些技术来避免这种问题,但是总觉得不够优雅,不符合我的美学!
后来看到这篇博客 C# 实现 Snowflake算法 先感谢一下这个大神。但是同样有上述的部分问题,做5线程的并发测试的时候效率不如扩展的。后面我们会提到。
我从这篇博客里摘来了源码,对有的地方做了一些改动使得其更适合(至少我认为是)更适合生产环境。
先贴源码
public class SFID
{
/// <summary>
/// 机器码
/// </summary>
private static long _workerId; /// <summary>
/// 初始基准时间戳,小于当前时间点即可
/// 分布式项目请保持此时间戳一致
/// </summary>
private static long _twepoch = 0L; /// <summary>
/// 毫秒计数器
/// </summary>
private static long sequence = 0L; /// <summary>
/// 机器码字节数。4个字节用来保存机器码(定义为Long类型会出现,最大偏移64位,所以左移64位没有意义)
/// </summary>
private static int workerIdBits = ; /// <summary>
/// 最大机器ID所占的位数
/// </summary>
private static long maxWorkerId = -1L ^ -1L << workerIdBits; /// <summary>
/// 计数器字节数,10个字节用来保存计数码
/// </summary>
private static int sequenceBits = ; /// <summary>
/// 机器码数据左移位数,就是后面计数器占用的位数
/// </summary>
private static int workerIdShift = sequenceBits; /// <summary>
/// 时间戳左移动位数就是机器码和计数器总字节数
/// </summary>
private static int timestampLeftShift = sequenceBits + workerIdBits; /// <summary>
/// 一微秒内可以产生计数,如果达到该值则等到下一微妙在进行生成
/// </summary>
private static long sequenceMask = -1L ^ -1L << sequenceBits; /// <summary>
/// 最后一次的时间戳
/// </summary>
private static long lastTimestamp = -1L; /// <summary>
/// 线程锁对象
/// </summary>
private static object locker = new object(); static SFID()
{
_workerId = new Random(DateTime.Now.Millisecond).Next(, (int)maxWorkerId);
_twepoch = timeGen(, , , , , );
} /// <summary>
/// 机器编号
/// </summary>
public static long WorkerID
{
get { return _workerId; }
set
{
if (value > && value < maxWorkerId)
_workerId = value;
else
throw new Exception("Workerid must be greater than 0 or less than " + maxWorkerId);
}
} /// <summary>
/// 获取新的ID
/// </summary>
/// <returns></returns>
public static long NewID()
{
lock (locker)
{
long timestamp = timeGen();
if (lastTimestamp == timestamp)
{ //同一微妙中生成ID
sequence = (sequence + ) & sequenceMask; //用&运算计算该微秒内产生的计数是否已经到达上限
if (sequence == )
{
//一微妙内产生的ID计数已达上限,等待下一微妙
timestamp = tillNextMillis(lastTimestamp);
}
}
else
{ //不同微秒生成ID
sequence = ; //计数清0
}
if (timestamp < lastTimestamp)
{
//如果当前时间戳比上一次生成ID时时间戳还小,抛出异常,因为不能保证现在生成的ID之前没有生成过
throw new Exception(string.Format("Clock moved backwards. Refusing to generate id for {0} milliseconds", lastTimestamp - timestamp));
}
lastTimestamp = timestamp; //把当前时间戳保存为最后生成ID的时间戳
return (timestamp - _twepoch << timestampLeftShift) | _workerId << workerIdShift | sequence;
}
} /// <summary>
/// 获取下一微秒时间戳
/// </summary>
/// <param name="lastTimestamp"></param>
/// <returns></returns>
private static long tillNextMillis(long lastTimestamp)
{
long timestamp = timeGen();
while (timestamp <= lastTimestamp)
{
timestamp = timeGen();
}
return timestamp;
} /// <summary>
/// 当前时间戳
/// </summary>
/// <returns></returns>
private static long timeGen()
{
return (long)(DateTime.UtcNow - new DateTime(, , , , , , DateTimeKind.Utc)).TotalMilliseconds;
} /// <summary>
/// 指定时间戳
/// </summary>
/// <param name="Time">指定时间</param>
/// <returns></returns>
private static long timeGen(int Year, int Month, int Day, int Hour, int Minute, int Second)
{
var UtcTime = new DateTime(Year, Month, Day, Hour, Minute, Second, DateTimeKind.Utc);
return (long)(UtcTime - new DateTime(, , , , , , DateTimeKind.Utc)).TotalMilliseconds;
}
}
说下使用,理论上如果是单机部署,不用做任何配置工作
直接 SFID.NewID() 就可以使用。
如果分布式的话
.Net Framework项目在Application_Start中,.Net Core项目在Configure中添加 SFID.WorkerID = 1L; 就可以 1L换成你的不同机器代号就可以,建议从配置文件读取可以保证代码一致性。另外不要部署ID相同的服务器,很可能会出现ID冲突。
因为就用了4位,所以最大只支持16台机器,如果不够用,可以去改workerIdBits的值,但是注意,这样会压缩ID的使用寿命,如果改为10位的话,大概可以用69年。
起始时间,我的为了保持一致使用了2010年1月1日0时。ID的使用寿命则是以这个时间点进行计算的。如果觉得不够用修代码中构造方法里的时间。但是注意多台保持一致。否则不能保证ID顺序递增。
然后大概说说修改思路。
1、关于实例化ID算法对象这个事,我觉得与其每次都初始化,然后费了半天劲保持对象生存,不如直接使用单例模式。所以方法不需要再单独实例化。
但是这么做也是有缺点的,如果我想业务A和业务B分别使用不同ID的序列,那么多实例模式则更适合,两个不同的业务,占位可以不一样,并且允许出现相同ID,更节省ID,效率也相对较高。
2、关于效率不高的问题,其实是原来的代码中计数器位过短造成的,并发达到数量达到可分配ID的峰值后,线程就会锁死不再发放ID,直到下一毫秒。
知道问题就很好解决了,调整大计数器长度,压缩服务器编号占位(我觉得实际生产中,很少有机会会用到1K台机器并发)。
以上,有问题或者有错误欢迎指出,可以直接给我发消息或者邮件我
[C#] 分布式ID自增算法 Snowflake的更多相关文章
- id生成器,分布式ID自增算法(Snowflake 算法)
接口: /** * id生成器 */ public interface IdGenerator { String next(); } 实现类: /** * 分布式ID自增算法<br/> * ...
- 适用于分布式ID的雪花算法
基于Java实现的适用于分布式ID的雪花算法工具类,这里存一下日后好找 /** * 雪花算法生成ID */ public class SnowFlakeUtil { private final sta ...
- 分布式ID生成 - 雪花算法
雪花算法是一种生成分布式全局唯一ID的经典算法,关于雪花算法的解读网上多如牛毛,大多抄来抄去,这里请参考耕耘的小象大神的博客ID生成器,Twitter的雪花算法(Java) 网上的教程一般存在两个问题 ...
- 分布式ID的雪花算法及坑
分布式ID生成是目前系统的常见刚需,其中以Twitter的雪花算法(Snowflake)比较知名,有Java等各种语言的版本及各种改进版本,能生成满足分布式ID,返回ID为Long长整数 但是这里有一 ...
- 生成主键ID,唯一键id,分布式ID生成器雪花算法代码实现
工具类: package com.ihrm.common.utils; import java.lang.management.ManagementFactory; import java.net. ...
- 分布式ID系列(5)——Twitter的雪法算法Snowflake适合做分布式ID吗
介绍Snowflake算法 SnowFlake算法是国际大公司Twitter的采用的一种生成分布式自增id的策略,这个算法产生的分布式id是足够我们我们中小公司在日常里面的使用了.我也是比较推荐这一种 ...
- 分布式ID解决方案
开发十年,就只剩下这套Java开发体系了 >>> 在游戏开发中,我们使用分布式ID.有很多优点 便于合服 便于ID管理 等等 一.单服各自ID系统的弊端 1. 列如合服 在游戏上 ...
- 大型互联网公司分布式ID方案总结
ID是数据的唯一标识,传统的做法是利用UUID和数据库的自增ID,在互联网企业中,大部分公司使用的都是Mysql,并且因为需要事务支持,所以通常会使用Innodb存储引擎,UUID太长以及无序,所以并 ...
- 分布式id生成方案总结
本文已经收录自 JavaGuide (60k+ Star[Java学习+面试指南] 一份涵盖大部分Java程序员所需要掌握的核心知识.) 本文授权转载自:https://juejin.im/post/ ...
随机推荐
- react-router 离开路由前确认
react路由在做离开前确认时,有两种方法 第一种是我们写的是动态路由,可以做一个简单的离开前确认 path: '/association/administration', component: Ad ...
- RabbitMQ入门-Routing直连模式
Hello World模式,告诉我们如何一对一发送和接收消息: Work模式,告诉我们如何多管齐下高效的消费消息: Publish/Subscribe模式,告诉我们如何广播消息 那么有没有灵活强一点的 ...
- mybatis 详解(四)------properties以及别名定义
上一篇博客我们介绍了mybatis的增删改查入门实例,我们发现在 mybatis-configuration.xml 的配置文件中,对数据库的配置都是硬编码在这个xml文件中,如下图,那么我们如何改进 ...
- Pandas 操作
一.Series的创建: pd.Series([ 数据 ]) In [17]: import pandas as pd In [18]: import numpy as np In [19]: s = ...
- 剑指offer--二叉树的后序遍历
思路:对于一个二叉树的后序遍历序列来说,最后一个数一定是根节点,然后前面的数中,从最开始到第一个大于根节点的数都是左子树中的数,而后面到倒数第二个数应该都是大于根节点的,是右子树,如果后面的数中有小于 ...
- 如何使用Androidstudio创建一个新项目
首先打开AS,然后 选择第一个选项Start a new Android Studio project 填写包名和项目名,点击next 选择项目类型,点击next 选择UI类型(都是死丢丢帮你生成的) ...
- python常用模块(2)
之前学了两个常用的模块collections和re模块今天我们接着学习其他几个常用模块.都是比较常用的之前的学习或多或少也有所接触比如说时间模块等. 预习: 写一个验证码 首先 要有数字 其次 要有字 ...
- oAuth 认证
这段时间公司开发项目用到oAuth2协议,现在做一下梳理. CORS即Cross Origin Resouce Share,跨域资源共享:是W3C为防止脚本攻击,而制定的安全标准之一,它云溪浏览器向跨 ...
- Code Complete
一.<代码大全>优先阅读参考顺序: 自学编程人:第07章 高质量的子程序 低年级学生:第11章 变量命名的力量 高年级学生:第08章 防御式编程 初级程序员:第18章 表驱动法 高级程序员 ...
- Consul文档简要整理
什么是Consul? Consul是一个用来实现分布式系统的服务发现与配置的开源工具.他主要由多个组成部分: 服务发现:客户端通过Consul提供服务,类似于API,MySQL,或者其他客户端可以使用 ...