大数据量.csv文件导入SQLServer数据库

前几天拿到了一个400多M的.csv文件，在电脑上打开要好长时间，打开后里面的数据都是乱码。因此，做了一个先转码再导入数据库的程序。100多万条的数据转码+导入在本地电脑上花了4分钟，感觉效率还可以。各位网友有更好的方法，请在留言中指点下，一起学习，多谢了。

 static void Main(string[] args)

         {

             int count = ;

             string readerPath=@"C:\Users\Administrator\Desktop\readerDemo.csv";

             string writerPath=@"C:\Users\Administrator\Desktop\writeDemo.csv";

             if (File.Exists(writerPath))

             {

                 File.Delete(writerPath);

             }

             using (StreamReader reader = new StreamReader(readerPath,Encoding.UTF8))

             {

                 while (!reader.EndOfStream)

                 {

                     string line = reader.ReadLine();

                     using (StreamWriter writer = new StreamWriter(writerPath, true,Encoding.Default))

                     {

                         writer.WriteLine(line);

                     }

                     count++;

                     Console.WriteLine("正在转码第{0}行,请稍等",count);

                 }

             }

             Console.WriteLine("转码完成，共转码{0}条数据",count);

             Console.WriteLine("开始导入数据，请稍等");
　　　　　　　　　//开始向数据库导入数据

             string sql = "BULK INSERT Test.dbo.BagDataTable FROM 'C:\\Users\\Administrator\\Desktop\\writeDemo.csv' WITH(FIELDTERMINATOR=',',BATCHSIZE=100000,FIRSTROW=2)";

             try

             {

                 DbHelper.ExecuteSql(sql);//使用的是方法ExecuteNonQuery()方法，具体的Helper就不上传了。

             }

             catch(Exception ex)

             {

                 using (StreamWriter writerLog = new StreamWriter(@"C:\Users\Administrator\Desktop\Log.txt"))

                 {

                     writerLog.WriteLine(ex.ToString());

                 }

             }

             Console.WriteLine("数据导入完毕");

             Console.ReadKey();

         }

     }

Bulk Insert命令详细：
http://blog.csdn.net/jackmacro/article/details/5959321/

FIELDTERMINATOR表示csv文件中的结束符标志(csv默认列结束标志是,行结束标志是\r\n)，具体使用参看:
http://www.cnblogs.com/sunice/p/6367332.html

大数据量.csv文件导入SQLServer数据库的更多相关文章

MYSQL数据库导入大数据量sql文件失败的解决方案
1.在讨论这个问题之前首先介绍一下什么是"大数据量sql文件". 导出sql文件.选择数据库-----右击选择"转储SQL文件"-----选择"结构和 ...
将DBF文件导入Sqlserver数据库
项目中的问题:用户选择N个dbf文件导入sql2005数据库,由于每年dbf表结构都在变化,所以在sql2005中根本就不存在,需要每年根据dbf的结构自动建表.(文章来自http://blog.cs ...
将TXT文件导入 sqlserver数据库
情景一: 数据库已存在旧表名 old_table,列名old_column_name. 将TXT文件导入数据库已存在旧表old_table中,导入过程中需注意数据源中列名可全部不修改或全部修改 ...
使用OPENROWSET、Microsoft.ACE.OLEDB实现大数据量的高效导入
首先说明使用的环境是:java和Sqlserver. 最近公司需要进行大数据量的导入操作.原来使用的是Apache POI,虽然可以实现功能,但是因为逻辑处理中需要进行许多校验,处理速度太慢,使用多线 ...
大数据量下的SQL Server数据库自身优化
原文: http://www.d1net.com/bigdata/news/284983.html 1.1:增加次数据文件从SQL SERVER 2005开始,数据库不默认生成NDF数据文件,一般情 ...
POI3.8解决导出大数据量excel文件时内存溢出的问题
POI3.8的SXSSF包是XSSF的一个扩展版本,支持流处理,在生成大数据量的电子表格且堆空间有限时使用.SXSSF通过限制内存中可访问的记录行数来实现其低内存利用,当达到限定值时,新一行数据的加入 ...
CSV文件导入到数据库中读取数据详解(接着上个帖子)
一.controller层二.SERVICE层 @Overridepublic Result importJinjiangAssessResult(MultipartFile file) throw ...
(转)大数据量下的SQL Server数据库优化
在SQL Server中,默认MDF文件初始大小为5MB,自增为1MB,不限增长,LDF初始为1MB,增长为10%,限制文件增长到一定的数目:一般设计中,使用SQL自带的设计即可,但是大型数据库设计 ...
将csv文件导入sql数据库
有一个csv文件需要导入到Sql数据库中,其格式为 “adb”,"dds","sdf" “adb”,"dds","sdf" ...

随机推荐

团体程序设计天梯赛-练习集-L1-028. 判断素数
L1-028. 判断素数本题的目标很简单,就是判断一个给定的正整数是否素数. 输入格式: 输入在第一行给出一个正整数N(<=10),随后N行,每行给出一个小于231的需要判断的正整数. 输出格 ...
vc++文本框的编辑
新建mfc应用程序,单文档,起名Text,先编译一下首先要创建一个插入符,用CreateSolid 窗口的高度宽度,可以通过GetSystemMetrics()函数获取视类是覆盖在框架类之上的创 ...
vue中使用base64进行加解密
vue进行Base64加解密背景项目中需要对特殊字符进行处理,避免json和数据库的特殊字符(""等)冲突,刚好学了信息安全,干脆整个加解密,wkk.. 使用步骤打开dos, ...
Codeforces Round #471 (Div. 2)A. Feed the cat
After waking up at hh:mm, Andrew realised that he had forgotten to feed his only cat for yet another ...
php的优缺点(转)
1. 跨平台,性能优越,跟Linux/Unix结合别跟Windows结合性能强45%,并且和很多免费的平台结合非常省钱,比如LAMP(Linux /Apache/Mysql/PHP)或者FAMP(Fr ...
3.3、Ansible命令参数详解
0.ansible 命令参数详解: [root@localhost ~]# ansible Usage: ansible <host-pattern> [options] Options: ...
Python 绘制2016世界GDP地图
2016世界GDP地图从https://datahub.io/core/gdp#data下载得到json文件. # country_code.py 获取国家二字代码 # 从pygal.maps.wo ...
maven引入jsp相关依赖
 <dependency> <groupId>javax.servlet</groupId> <artifac ...
Java基础学习总结（61）——Java项目开发要注意的60个问题
1. 首先写代码的时候最好不要有缺陷.最好的修复方法就是让 bug 胎死腹中. 良好的单元测试强制数据库约束使用输入验证框架避免未实现的"else"条件在应用到主程序之前知 ...
centos solr 集群搭建
一.什么是 SolrCloud SolrCloud(solr 云)是 Solr 提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud.当一个系统的索引数据量少的时 ...

大数据量.csv文件导入SQLServer数据库

大数据量.csv文件导入SQLServer数据库的更多相关文章

随机推荐

热门专题