数据迁移最快方式,多线程并行执行 Sql插入
前言:
由于系统升级,新开发的系统对数据验证,及数据关联做了很多优化,现需要将原历史版本的数据迁移到新系统中;原数据库大约有 1千多万数据,大约 50个表。
历史数据库命名为:A。 新系统库暂命名为 :B;
使用 .net 4.5 控制台程序 + EF + MSSQL 数据库,由于有业务逻辑及时序处理,故只能按时序从单表一条条的写入到新库中;
化化过程:
1、EF 如果使用多线程会出现 Sql 连接超过,或是连接不上数据库;
2、EF 优化连接 自定义 SqlConnection,并传到入 多线程中,解决连接不上数据库的问题减少数据库连接数,但由于 EF 在 SaveChangesAsync的时候做了事务提交,但事务是不支持并行操作,故会出现异常;
3、EF 优化事务,关闭EF默认事务 DbContextConfiguration.EnsureTransactionsForFunctionsAndCommands = false; 这里有个坑 关闭事务对 SaveChangesAsync 无效,问题依然存在;
4、找了很多资料总算找到可以通过 ExecuteSqlCommandAsync 执行 Sql 语句,可以关闭事务;
5、优化成执行Sql 语句:await db.Database.ExecuteSqlCommandAsync(TransactionalBehavior.DoNotEnsureTransaction, sql, SqlParameters[]);
经过以上优化处理后,就开始写代码:
一、关键的异步锁程序:
/// <summary>
/// 提供异步锁
/// </summary>
class AsyncRoot : IDisposable
{
/// <summary>
/// 信号量
/// </summary>
private readonly SemaphoreSlim semaphoreSlim; /// <summary>
/// 异步锁
/// </summary>
public AsyncRoot()
: this()
{
} /// <summary>
/// 异步锁
/// </summary>
/// <param name="concurrent">允许并行的线程数</param>
public AsyncRoot(int concurrent)
{
this.semaphoreSlim = new SemaphoreSlim(concurrent, concurrent);
} /// <summary>
/// 锁住代码块
/// using( asyncRoot.Lock() ){ }
/// </summary>
/// <returns></returns>
public IDisposable Lock()
{
this.semaphoreSlim.Wait();
return new UnLocker(this.semaphoreSlim);
} /// <summary>
/// 锁住代码块
/// using( await asyncRoot.LockAsync() ){ }
/// </summary>
/// <returns></returns>
public async Task<IDisposable> LockAsync()
{
await this.semaphoreSlim.WaitAsync().ConfigureAwait(false);
return new UnLocker(this.semaphoreSlim);
} /// <summary>
/// 释放资源
/// </summary>
public void Dispose()
{
this.semaphoreSlim.Dispose();
} /// <summary>
/// 提供解锁
/// </summary>
class UnLocker : IDisposable
{
/// <summary>
/// 信号量
/// </summary>
private readonly SemaphoreSlim semaphoreSlim; /// <summary>
/// 解锁
/// </summary>
/// <param name="semaphoreSlim">信号量</param>
public UnLocker(SemaphoreSlim semaphoreSlim)
{
this.semaphoreSlim = semaphoreSlim;
} /// <summary>
/// 释放锁
/// </summary>
public void Dispose()
{
this.semaphoreSlim.Release();
}
}
}
多线层异常锁
二、对数据插入到数据库:
逻辑分析:对传入的 数据集合,拆分为单个实体操作任务,每个任务使用同一个连接,独立的数据库上下文,对实体反射为 Sql 语句(其中增加主键,表名、字段名、值的判断验证),
然后通过 ExecuteSqlCommandAsync 不使用事务的方式执行 Sql 语句;具体代码见下:
//表示最大线程数
private readonly AsyncRoot root = new AsyncRoot(50);
/// <summary>
/// 多线程工作
/// </summary>
public class Workers
{
/// <summary>
/// 多线程锁
/// </summary>
private readonly AsyncRoot root = new AsyncRoot(); /// <summary>
/// 执行对象操作
/// </summary>
/// <param name="datas"></param>
/// <returns></returns>
public async Task RunAsync<T>(IEnumerable<T> datas) where T : class
{
//创建 Sql 连接
var connection = new SqlConnection(System.Configuration.ConfigurationManager.ConnectionStrings["SqlDb"].ConnectionString);
await connection.OpenAsync();
var tasks = datas.Select(item => SaveToDbAsync(item, connection));
await Task.WhenAll(tasks);
} /// <summary>
/// 单条记录保存到数据库
/// </summary>
/// <typeparam name="T"></typeparam>
/// <param name="data"></param>
/// <param name="connection"></param>
/// <returns></returns>
private async Task SaveToDbAsync<T>(T data, DbConnection connection) where T : class
{
using (await root.LockAsync())
{
using (var db = new SqlDb(connection))
{
try
{
var dbset = db.Set<T>();
var tType = typeof(T);
var tableName = tType.Name;
//获取 TableAttribute 数据库中的表名
var tableAtt = Attribute.GetCustomAttribute(tType, typeof(TableAttribute)) as TableAttribute;
if (tableAtt != null)
{
tableName = tableAtt.Name;
} var sbSql = new StringBuilder(); sbSql.AppendLine("insert into " + tableName + " (");
var plist = new List<string>();
var fieldParameters = new List<SqlParameter>();
var keyFiled = "ID";
foreach (var p in typeof(T).GetProperties())
{
var pName = p.Name.ToUpper();
//获取 ColumnAttribute 数据库中的列名
var pAtt = Attribute.GetCustomAttribute(p, typeof(ColumnAttribute)) as ColumnAttribute;
if (pAtt != null)
{
pName = pAtt.Name.ToUpper();
} var keyAtt = Attribute.GetCustomAttribute(p, typeof(KeyAttribute)) as KeyAttribute;
if (keyAtt != null || p.Name.Equals("ID", StringComparison.OrdinalIgnoreCase))
{
keyFiled = pName;
} var fieldParameter = "@" + pName;
//过滤不插入数据库中的字段
var mapAtt = Attribute.GetCustomAttribute(p, typeof(NotMappedAttribute));
if (mapAtt == null)
{
var value = p.GetValue(data, null);
//如果属性值为 Null,不插入数据库
if (value != null)
{
plist.Add(fieldParameter);
fieldParameters.Add(new SqlParameter(fieldParameter, value));
}
}
}
sbSql.Append(string.Join(",", plist.Select(item => item.Replace("@", ""))));
sbSql.Append(")values(");
sbSql.Append(string.Join(",", plist));
sbSql.Append(")");
//判断主键是否已经存在,存在就不插入数据
var ifSql = "if not exists(select 1 from [" + tableName + "] where " + keyFiled + " = @" + keyFiled + ")"; var sql = ifSql + sbSql.ToString();
await db.Database.ExecuteSqlCommandAsync(TransactionalBehavior.DoNotEnsureTransaction, sql, fieldParameters.ToArray());
}
catch (Exception ex)
{
Console.WriteLine(ex);
}
}
}
}
}
多线程及对象生成 Sql插入数据库
/// <summary>
/// Sql数据库
/// </summary>
public class SqlDb : DbContext
{
/// <summary>
/// 自定义连接
/// </summary>
/// <param name="connection">数据库连接</param>
public SqlDb(DbConnection connection) :
base(connection, false)
{
if (connection.State != System.Data.ConnectionState.Open)
{
connection.Open();
} this.Database.CommandTimeout = * ;
this.Configuration.UseDatabaseNullSemantics = true;
this.Configuration.EnsureTransactionsForFunctionsAndCommands = false;
this.Configuration.ValidateOnSaveEnabled = false;
}
}
数据库上下文
三、注意事项:
1、如果字段为 geography (地理位置) 类型,会出现异常,希望在使用的时候注意一下;
2、由于集合为同一个对象,故在每次反射的对象几乎都是重复操作,可以根据实际情况增加缓存;
其它:
多线程并行操作小实例源码:https://github.com/intotf/netExample/tree/master/Tool/MultiTaskAsync
数据迁移最快方式,多线程并行执行 Sql插入的更多相关文章
- 一种可以避免数据迁移的分库分表scale-out扩容方式
原文地址:http://jm-blog.aliapp.com/?p=590 目前绝大多数应用采取的两种分库分表规则 mod方式 dayofweek系列日期方式(所有星期1的数据在一个库/表,或所有?月 ...
- [转]一种可以避免数据迁移的分库分表scale-out扩容方式
原文地址:http://jm-blog.aliapp.com/?p=590 目前绝大多数应用采取的两种分库分表规则 mod方式 dayofweek系列日期方式(所有星期1的数据在一个库/表,或所有?月 ...
- .Net5 IdentityServer4下SqlServer和Mysql数据迁移
1.概念 以下概念从官网整理的,我也是看官网一步一步学习的 官网地址 https://identityserver4.readthedocs.io/en/latest/index.html 1.1 I ...
- EF6:编写你自己的code first 数据迁移操作(睡前来一篇,翻译的)
原英文版由EF团队成员 Rowan Miller 在2013年发表,此处只作翻译备忘. 数据迁移提供了一套强类型API,用于执行通用的操作,比如CreateIndex("dbo.Blogs& ...
- 一种可以避免数据迁移的分库分表scale-out扩容模式
转自: http://jm.taobao.org/ 一种可以避免数据迁移的分库分表scale-out扩容方式 目前绝大多数应用采取的两种分库分表规则 mod方式 dayofweek系列日期方式(所有星 ...
- gitblit 数据迁移(复制)
gitblit 数据迁移 完全拷贝方式: 将原服务器上的gitblit的安装目录.数据目录等相关目录拷到另一台服务器上即可,这样启动方式和使用端口及数据和原服务上的一模一样.(因为gitblit是不用 ...
- MySQL数据迁移到MSSQL-以小米数据库为例-测试828W最快可达到2分11秒
这里采用.NET Framework 4.0以上版本中新出现的 ConcurrentQueue<T> 类 MSDN是这样描述的: ConcurrentQueue<T> 类是一个 ...
- SQL SERVER 2000/2005/2008数据库数据迁移到Oracle 10G细述
最近参与的一个系统涉及到把SQL Server 2k的数据迁移到Oracle 10G这一非功能需求.特将涉及到相关步骤列举如下供大家参考: 环境及现有资源: 1.OS: Windows 7 Enter ...
- SQL Server GUID 数据迁移至MongoDB后怎样查看?
关键字:SQL Server NEWID():BSON:MongoDB UUID 1.遇到的问题和困惑 SQL Server中的NEWID数据存储到MongoDB中会是什么样子呢?发现不能简单的通过此 ...
随机推荐
- Redis for OPS 01:关于 Redis 基础说明与安装部署
写在前面的话 本章节开始在主要介绍在运维工作中绕不开的一个话题,数据缓存 NoSQL 服务 Redis,搭建很简单,使用很简单,运行也稳定的一批,一般小公司几乎很少出现以为量的问题导致他 down 掉 ...
- 接口的 COM 组件调用 QueryInterface 因以下错误而失败: 库没有注册。
这个问题原因是因为安装了高版本的office然后卸载掉,又安装了低版本的office导致的. 博主是 office2016卸载后,安装了office2013. EXCEL报错信息为: 无法将类型为“M ...
- serf 中去中心化系统的原理和实现
原文:https://www.infoq.cn/article/principle-and-impleme-of-de-centering-system-in-serf serf 是出自 Hashic ...
- .net 定时任务调度
前段时间开发个项目需要自定义时间定时发送邮件,此处使用了Quartz 定时任务,在此记录下: /// <summary> /// 创建定时任务 /// </summary> / ...
- Z从壹开始前后端分离【 .NET Core2.2/3.0 +Vue2.0 】框架之六 || API项目整体搭建 6.1 仓储+服务+抽象接口模式
本文梯子 本文3.0版本文章 前言 零.完成图中的粉色部分 2019-08-30:关于仓储的相关话题 一.创建实体Model数据层 二.设计仓储接口与其实现类 三.设计服务接口与其实现类 四.创建 C ...
- MySQL学习——操作视图
MySQL学习——操作视图 摘要:本文主要学习了使用DDL语句操作视图的方法. 了解视图 是什么 视图是从一个.多个表或者视图中导出的表,包含一系列带有名称的数据列和若干条数据行. 特点 视图不是数据 ...
- C#中巧用Lambda表达式实现对象list进行截取
场景 有一个对象的list,每个对象有唯一的属性Id,并且是从1递增,现在要根据此Id属性进行截取. 其中DataTreeNode 实现 Global.Instance.PrepareCompareD ...
- JavaScript 数学
JavaScript Math 数学 神奇的圆周率 Math.PI ; // 返回 3.1415926535-- Math 数学方法 Math.round() Math.round(X):返回 X 的 ...
- C# Dictionary增加的方法
1.简单的函数,实现Dictionary如果有就替换,没有就增加的功能. /// <summary> /// Dictionary增加的方法 /// </ ...
- Discuz! X3 数据表、数据字段说明
pre_common_admincp_cmenu 后台菜单收藏表 字段名 数据类型 默认值 允许非空 自动递增 备注 id smallint(6) unsigned NO 是 title v ...