C# 之批量插入数据到 SQLServer 中

　　创建一个用来测试的数据库和表，为了让插入数据更快，表中主键采用的是GUID，表中没有创建任何索引。GUID必然是比自增长要快。而如果存在索引的情况下，每次插入记录都会进行索引重建，这是非常耗性能的。如果表中无可避免的存在索引，我们可以通过先删除索引，然后批量插入，最后再重建索引的方式来提高效率。

create database CarSYS;

go

use CarSYS;

go

CREATE TABLE Product(

Id UNIQUEIDENTIFIER PRIMARY KEY,

NAME VARCHAR(50) NOT NULL,

Price DECIMAL(18,2) NOT NULL

)

　　通过SQL脚本来插入数据，常见如下四种方式。

　　一、通过 INSERT INTO tname (...) VALUES (...) 逐条插入，性能最差，不建议使用。

　　示例：

#region 方式一

        static void InsertOne()

        {

            Console.WriteLine("采用一条一条插入的方式实现");

            Stopwatch sw = new Stopwatch();

            using (SqlConnection conn = new SqlConnection(StrConnMsg)) //using中会自动Open和Close 连接。

            {

                string sql = "INSERT INTO Product(Id,Name,Price) VALUES(newid(),@p,@d)";

                conn.Open();

                for (int i = ; i < totalRow; i++)

                {

                    using (SqlCommand cmd = new SqlCommand(sql, conn))

                    {

                        cmd.Parameters.AddWithValue("@p", "商品" + i);

                        cmd.Parameters.AddWithValue("@d", i);

                        sw.Start();

                        cmd.ExecuteNonQuery();

                        Console.WriteLine(string.Format("插入一条记录，已耗时{0}毫秒", sw.ElapsedMilliseconds));

                    }

                    if (i == getRow)

                    {

                        sw.Stop();

                        break;

                    }

                }

            }

            Console.WriteLine(string.Format("插入{0}条记录，每{4}条的插入时间是{1}毫秒,预估总得插入时间是{2}毫秒，{3}分钟",

 totalRow, sw.ElapsedMilliseconds, ((sw.ElapsedMilliseconds / getRow) * totalRow), GetMinute((sw.ElapsedMilliseconds / getRow * totalRow)), getRow));

        }

        static int GetMinute(long l)

        {

            return (Int32)l / ;

        }

        #endregion

　　运行结果如下：

　　结果显示插入100w条记录，预计需要50分钟时间，每插入一条记录大概需要3毫秒左右。

　　二、使用 insert bulk

BULK INSERT [ [ 'database_name'.][ 'owner' ].]{ 'table_name' FROM 'data_file' }

    WITH  (

            [ BATCHSIZE [ = batch_size ] ],

            [ CHECK_CONSTRAINTS ],

            [ CODEPAGE [ = 'ACP' | 'OEM' | 'RAW' | 'code_page' ] ],

            [ DATAFILETYPE [ = 'char' | 'native'| 'widechar' | 'widenative' ] ],

            [ FIELDTERMINATOR [ = 'field_terminator' ] ],

            [ FIRSTROW [ = first_row ] ],

            [ FIRE_TRIGGERS ],

            [ FORMATFILE = 'format_file_path' ],

            [ KEEPIDENTITY ],

            [ KEEPNULLS ],

            [ KILOBYTES_PER_BATCH [ = kilobytes_per_batch ] ],

            [ LASTROW [ = last_row ] ],

            [ MAXERRORS [ = max_errors ] ],

            [ ORDER ( { column [ ASC | DESC ] } [ ,...n ] ) ],

            [ ROWS_PER_BATCH [ = rows_per_batch ] ],

            [ ROWTERMINATOR [ = 'row_terminator' ] ],

            [ TABLOCK ],

    )

　　相关参数说明：

BULK INSERT

   [ database_name . [ schema_name ] . | schema_name . ] [ table_name | view_name ]

      FROM 'data_file'

     [ WITH

        (

   [ [ , ] BATCHSIZE = batch_size ]    --BATCHSIZE指令来设置在单个事务中可以插入到表中的记录的数量

   [ [ , ] CHECK_CONSTRAINTS ]     --指定在大容量导入操作期间，必须检查所有对目标表或视图的约束。若没有 CHECK_CONSTRAINTS 选项，则所有 CHECK 和 FOREIGN KEY 约束都将被忽略，并且在此操作之后表的约束将标记为不可信。

   [ [ , ] CODEPAGE = { 'ACP' | 'OEM' | 'RAW' | 'code_page' } ]  --指定该数据文件中数据的代码页

   [ [ , ] DATAFILETYPE =

      { 'char' | 'native'| 'widechar' | 'widenative' } ]  --指定 BULK INSERT 使用指定的数据文件类型值执行导入操作。

   [ [ , ] FIELDTERMINATOR = 'field_terminator' ]  --标识分隔内容的符号

   [ [ , ] FIRSTROW = first_row ]    --指定要加载的第一行的行号。默认值是指定数据文件中的第一行

   [ [ , ] FIRE_TRIGGERS ]     --是否启动触发器

   [ [ , ] FORMATFILE = 'format_file_path' ]

   [ [ , ] KEEPIDENTITY ]   --指定导入数据文件中的标识值用于标识列

   [ [ , ] KEEPNULLS ]    --指定在大容量导入操作期间空列应保留一个空值，而不插入用于列的任何默认值

   [ [ , ] KILOBYTES_PER_BATCH = kilobytes_per_batch ]

   [ [ , ] LASTROW = last_row ]   --指定要加载的最后一行的行号

   [ [ , ] MAXERRORS = max_errors ]   --指定允许在数据中出现的最多语法错误数，超过该数量后将取消大容量导入操作。

   [ [ , ] ORDER ( { column [ ASC | DESC ] } [ ,...n ] ) ]  --指定数据文件中的数据如何排序

   [ [ , ] ROWS_PER_BATCH = rows_per_batch ]

   [ [ , ] ROWTERMINATOR = 'row_terminator' ]   --标识分隔行的符号

   [ [ , ] TABLOCK ]     --指定为大容量导入操作持续时间获取一个表级锁

   [ [ , ] ERRORFILE = 'file_name' ]   --指定用于收集格式有误且不能转换为 OLE DB 行集的行的文件。

        )]

#region 方式二

        static void InsertTwo()

        {

            Console.WriteLine("使用Bulk插入的实现方式");

            Stopwatch sw = new Stopwatch();

            DataTable dt = GetTableSchema(); 

            using (SqlConnection conn = new SqlConnection(StrConnMsg))

            {

                SqlBulkCopy bulkCopy = new SqlBulkCopy(conn);

                bulkCopy.DestinationTableName = "Product";

                bulkCopy.BatchSize = dt.Rows.Count;

                conn.Open();

                sw.Start();

                for (int i = ; i < totalRow;i++ )

                {

                    DataRow dr = dt.NewRow();

                    dr[] = Guid.NewGuid();

                    dr[] = string.Format("商品", i);

                    dr[] = (decimal)i;

                    dt.Rows.Add(dr);

                }

                    if (dt != null && dt.Rows.Count != )

                    {

                        bulkCopy.WriteToServer(dt);

                        sw.Stop();

                    }

                    Console.WriteLine(string.Format("插入{0}条记录共花费{1}毫秒，{2}分钟", totalRow, sw.ElapsedMilliseconds, GetMinute(sw.ElapsedMilliseconds)));

            }

        }

        static DataTable GetTableSchema()

        {

            DataTable dt = new DataTable();

            dt.Columns.AddRange(new DataColumn[] {

        new DataColumn("Id",typeof(Guid)),

        new DataColumn("Name",typeof(string)),

        new DataColumn("Price",typeof(decimal))});

            return dt;

        }

        #endregion

　　运行结果如下：

　　插入100w条记录才8s多，推荐。

　　打开Sqlserver Profiler跟踪，会发现执行的是如下语句：

insert bulk Product ([Id] UniqueIdentifier, [NAME] VarChar(50) COLLATE Chinese_PRC_CI_AS, [Price] Decimal(18,2))

　　三、使用 INSERT INTO xx select...

INSERT INTO Product(Id,Name,Price)

 SELECT NEWID(),'牛栏1段',160

 UNION ALL

 SELECT NEWID(),'牛栏2段',180

 UNION ALL

......

　　从sqlserver 2008起开始支持TVPs。创建缓存表ProductTemp ，执行如下SQL：

CREATE TYPE ProductTemp AS  TABLE(

Id UNIQUEIDENTIFIER PRIMARY KEY,

NAME VARCHAR(50) NOT NULL,

Price DECIMAL(18,2) NOT NULL

)

　　执行完成之后，会发现在数据库CarSYS下面多了一张缓存表ProductTemp

　　可见插入100w条记录共花费了11秒多，此方式麻烦，一次性可使用。　　

　　四、拼接SQL

INSERT INTO Product(Id,Name,Price) VALUES

(newid(),'牛栏1段',160)

,(newid(),'牛栏2段',260)

......

　　示例：此种方法在C#中有限制，一次性只能批量插入1000条，所以就得分段进行插入。

#region 方式四

        static void InsertFour()

        {

            Console.WriteLine("采用拼接批量SQL插入的方式实现");

            Stopwatch sw = new Stopwatch();

            using (SqlConnection conn = new SqlConnection(StrConnMsg)) //using中会自动Open和Close 连接。

            {

                conn.Open();

                sw.Start();

                for (int j = ; j < totalRow / getRow;j++ )

                {

                    StringBuilder sb = new StringBuilder();

                    sb.Append("INSERT INTO Product(Id,Name,Price) VALUES");

                    using (SqlCommand cmd = new SqlCommand())

                    {

                        for (int i = ; i < getRow; i++)

                        {

                            sb.AppendFormat("(newid(),'商品{0}',{0}),", j*i+i);

                        }

                        cmd.Connection = conn;

                        cmd.CommandText = sb.ToString().TrimEnd(',');

                        cmd.ExecuteNonQuery();

                    }

                }

                sw.Stop();

                Console.WriteLine(string.Format("插入{0}条记录，共耗时{1}毫秒",totalRow,sw.ElapsedMilliseconds));

            }

        }

        #endregion

　　运行结果如下：

　　可以看到大概花费了10分钟。虽然在方式一的基础上，性能有了较大的提升，但是显然还是不够快。

　　总结：大数据批量插入方式一和方式四尽量避免使用，而方式二和方式三都是非常高效的批量插入数据方式。其都是通过构建DataTable的方式插入的，而我们知道DataTable是存在内存中的，所以当数据量特别特别大，大到内存中无法一次性存储的时候，可以分段插入。比如需要插入9千万条数据，可以分成9段进行插入，一次插入1千万条。而在for循环中直接进行数据库操作，我们是应该尽量避免的。每一次数据库的连接、打开和关闭都是比较耗时的，虽然在C#中存在数据库连接池，也就是当我们使用using或者conn.Close()，进行释放连接时，其实并没有真正关闭数据库连接，它只是让连接以类似于休眠的方式存在，当再次操作的时候，会从连接池中找一个休眠状态的连接，唤醒它，这样可以有效的提高并发能力，减少连接损耗。而连接池中的连接数，我们都是可以配置的。

C# 之批量插入数据到 SQLServer 中的更多相关文章

【转载】C#批量插入数据到Sqlserver中的三种方式
引用:https://m.jb51.net/show/99543 这篇文章主要为大家详细介绍了C#批量插入数据到Sqlserver中的三种方式,具有一定的参考价值,感兴趣的小伙伴们可以参考一下本篇, ...
C#批量插入数据到Sqlserver中的四种方式
我的新书ASP.NET MVC企业级实战预计明年2月份出版,感谢大家关注! 本篇,我将来讲解一下在Sqlserver中批量插入数据. 先创建一个用来测试的数据库和表,为了让插入数据更快,表中主键采用的 ...
C#批量插入数据到Sqlserver中的三种方式
本篇,我将来讲解一下在Sqlserver中批量插入数据. 先创建一个用来测试的数据库和表,为了让插入数据更快,表中主键采用的是GUID,表中没有创建任何索引.GUID必然是比自增长要快的,因为你生成 ...
C#_批量插入数据到Sqlserver中的四种方式
先创建一个用来测试的数据库和表,为了让插入数据更快,表中主键采用的是GUID,表中没有创建任何索引.GUID必然是比自增长要快的,因为你生成一个GUID算法所花的时间肯定比你从数据表中重新查询上一条记 ...
C#批量插入数据到Sqlserver中的四种方式 - 转
先创建一个用来测试的数据库和表,为了让插入数据更快,表中主键采用的是GUID,表中没有创建任何索引.GUID必然是比自增长要快的,因为你生成一个GUID算法所花的时间肯定比你从数据表中重新查询上一条记 ...
sql 批量插入数据到Sqlserver中效率较高的方法
使用SqlBulk #region 方式二 static void InsertTwo() { Console.WriteLine("使用Bulk插入的实现方式"); Stopwa ...
用SqlBulkCopy批量插入数据到SqlServer数据库表中
首先创建一个数据库连接类:SQLHelper using System; using System.Collections.Generic; using System.Linq; using Syst ...
.Net批量插入数据到SQLServer数据库,System.Data.SqlClient.SqlBulkCopy类批量插入大数据到数据库
批量的的数据导入数据库中,尽量少的访问数据库,高性能的对数据库进行存储. 采用SqlBulkCopy来处理存储数据.SqlBulkCopy存储大批量的数据非常的高效,将内存中的数据表直接的一次性的存储 ...
java批量插入数据进数据库中
方式1: for循环,每一次进行一次插入数据. 方式2: jdbc的preparedStatement的batch操作 PreparedStatement.addBatch(); ...... Pre ...

随机推荐

初窥Java之五
一.方法 1.语法格式修饰符返回值类型方法名(形参列表){ 方法体 } 2.返回值类型返回值类型可以时:1.void(无返回值) 2.8大基本数据类型中的任意一种 3.引用数据类型中的任意一 ...
1301 邻值查找（set 平衡树 | 链表）
描述给定一个长度为 n 的序列 A,A 中的数各不相同.对于 A 中的每一个数 A_i,求: min(1≤j<i) ⁡|A_i-A_j| 以及令上式取到最小值的 j(记为 P_i).若最小值点 ...
Best Cow Fences POJ - 2018 （二分）
Farmer John's farm consists of a long row of N (1 <= N <= 100,000)fields. Each field contains ...
this 相关
对于前端程序媛(员)来说,this这个机制应用的地方是很多的,所以搞懂是必要的,不熟练使用this将遇到一些困惑,下面是一些关于this的学习心得分享,希望大家可以一起学习: 1,this并不是指向自 ...
dhcp搭建
DHCP服务搭建动态主机配置协议 dhcp曾用名 bootp 应用规模:终端超过五台,建议使用DHCP分配的信息:IP地址,NETMASK掩码,GATEWAY网关,DNS1DNS服务器,DNS2,D ...
Wan Android 项目总结
Wan Android 项目总结项目的由来这个项目也算是自己学习了一段时间的Android以后的一个总结和学习吧,项目采用了Kotlin语言,Api采用的hongyang大神的WanAndroid ...
使用Log4j日志处理
Springboot日志默认使用的是logback,本文将介绍将springboot项目日志修改为log4j. 首先要将默认的日志依赖排除,然后引用log4j,pom文件代码如下: <?xml ...
OSPF补全计划-2
想起来几个面试题: 1. OSPF在什么情况下会stuck in Exstart /Exchange状态? 我知道的一个答案是两个端口的mtu不一致.当然整个也不是绝对,因为可以用ip ospf mt ...
c#窗体form的美化
LOJ.6074.[2017山东一轮集训Day6]子序列(DP 矩阵乘法)
题目链接参考yww的题解.本来不想写来但是他有一些笔误...而且有些地方不太一样就写篇好了. 不知不觉怎么写了这么多... 另外还是有莫队做法的...(虽然可能卡不过) \(60\)分的\(O(n^ ...

C# 之 批量插入数据到 SQLServer 中

C# 之 批量插入数据到 SQLServer 中的更多相关文章

随机推荐

热门专题

C# 之批量插入数据到 SQLServer 中

C# 之批量插入数据到 SQLServer 中的更多相关文章