首先说明使用的环境是:java和Sqlserver。

最近公司需要进行大数据量的导入操作。原来使用的是Apache POI,虽然可以实现功能,但是因为逻辑处理中需要进行许多校验,处理速度太慢,使用多线程之后也不尽如人意。在网上搜索之后,找到了OPENROWSET和OPENDATASOURCE,发现使用OPENROWSET,可以非常快速的把Excel导入到数据库中。之后的各种校验,我可以通过编写sql来实现。最终结果是6w条数据可以在10秒内完成。当然数据量增加之后,完成时间并不会明显增加。这需要编写的sql比较高效,是另一方面的问题了。

首先可能需要下载一个小的程序AccessDatabaseEngine_X64.exe。

之后需要开启配置

启用:

exec sp_configure 'show advanced options',1
reconfigure
exec sp_configure 'Ad Hoc Distributed Queries',1
reconfigure

关闭:

exec sp_configure 'Ad Hoc Distributed Queries',0
reconfigure
exec sp_configure 'show advanced options',0
reconfigure

之后可以通过OPENROWSET来查询Excel文件的内容。当然也可以改为SELECT INTO存到数据库中。

SELECT * FROM OPENROWSET('Microsoft.ACE.OLEDB.12.0',
'Excel 12.0;HDR=YES;Database=E:\DataBack\Copy of SD Expired Contracts.xlsx', ['Copy of SD Expired Contracts$'])

这样使用的前提是你知道需要导入的Sheet的名称。而如果不知道的话就需要使用下面的方法,查询出所有的Sheet名称,再由用户选择导入哪一个。

EXEC sp_addlinkedserver 'ExcelSource', '',
'Microsoft.ACE.OLEDB.12.0',
'E:\DataBack\Copy of SD Expired Contracts.xlsx',
NULL,
'Excel 8.0'
EXEC sp_addlinkedsrvlogin 'ExcelSource', 'false'
GO
EXECUTE SP_TABLES_EX 'ExcelSource'

下面是我的Java代码:

这个方法用户获得Sheet Name List。

	public static List<String> getSheetNameList(String filePath,BaseDao baseDao){
String excelSource = "ExcelSource_"+StringUtils.getUUIDString();
String addSourceSql = "{CALL SP_ADDLINKEDSERVER(?,'','Microsoft.ACE.OLEDB.12.0',?,NULL,'Excel 8.0')}";
SQLQuery query = baseDao.getSQLQuery(addSourceSql);
query.setParameter(0, excelSource);
query.setParameter(1, filePath);
query.executeUpdate();
String loginSourceSqql = "{CALL SP_ADDLINKEDSRVLOGIN(?,'false')}";
query = baseDao.getSQLQuery(loginSourceSqql);
query.setParameter(0, excelSource);
query.executeUpdate(); String sheetNameSql = "{CALL SP_TABLES_EX(?)}";
query = baseDao.getSQLQuery(sheetNameSql);
query.setParameter(0, excelSource);
query.setResultTransformer(Transformers.ALIAS_TO_ENTITY_MAP);
List<Map<String, Object>> list = query.list();
List<String> sheetList = new ArrayList<String>();
for(int i=0;i<list.size();i++){
String sheetName = (String) list.get(i).get("TABLE_NAME");
if(sheetName.endsWith("_xlnm#_FilterDatabase")){ }else{
sheetList.add(sheetName);
}
}
return sheetList;
}

这个方法用户创建一个临时表,存储Excel文件内容。临时表的字段名是根据Excel表头来创建的。

	public static String uploadAndCreateTable(String filePath,String sheetName,BaseDao baseDao) {
String importTableName = "tbl_zz_"+StringUtils.getUUIDString();
String uploadFileSql = "SELECT IDENTITY(int, 1, 1) as %s,t.*,CAST(NEWID() AS VARCHAR(36)) AS %s into %s FROM OPENROWSET('Microsoft.ACE.OLEDB.12.0','Excel 12.0;HDR=YES;Database=%s', [%s]) as t";
uploadFileSql = String.format(uploadFileSql,ImportVisitorUtil.importIndex,ImportVisitorUtil.importUUID,importTableName,filePath,sheetName);
SQLQuery query = baseDao.getSQLQuery(uploadFileSql);
query.executeUpdate();
replaceSpecialCharacter(baseDao, importTableName);
changeColumnCollation(baseDao, importTableName);
return importTableName;
}

代码编写过程中发现一个问题,如果Excel表头中含有":",在编写sql过程中会跟:name这种占位符冲突,我冒号替换成了空格。

	private static void replaceSpecialCharacter(BaseDao baseDao,String tableName){
String cha = ":";
String cha_ = "%:%";
String sql = "SELECT COLUMN_NAME columnName FROM INFORMATION_SCHEMA.COLUMNS WHERE TABLE_NAME = ? AND COLUMN_NAME like ? ";
SQLQuery query = baseDao.getSQLQuery(sql);
query.setParameter(0, tableName);
query.setParameter(1, cha_);
query.setResultTransformer(Transformers.ALIAS_TO_ENTITY_MAP);
List<Map<String,Object>> list = query.list();
for(Map<String,Object> map : list){
String columnName = (String) map.get("columnName");
String newColumnName = columnName.replace(cha, " ");
String tableColumnName = String.format("%s.[%s]", tableName, columnName);
String changeSql = "{CALL SP_RENAME(?,?,'column')}";
query = baseDao.getSQLQuery(changeSql);
query.setParameter(0, tableColumnName);
query.setParameter(1, newColumnName);
query.executeUpdate();
}
}

另一个问题是,本地数据库安装的时候使用的排序规则与服务器不一致,导致编写的sql运行时出现错误,提前修改排序规则。  

	private static void changeColumnCollation(BaseDao baseDao,String tableName){
String defaultCollation = "SQL_Latin1_General_CP1_CI_AS";
String dataType = "nvarchar";
String sql = "SELECT COLUMN_NAME AS columnName,CHARACTER_MAXIMUM_LENGTH AS length FROM INFORMATION_SCHEMA.COLUMNS WHERE TABLE_NAME = ? AND COLLATION_NAME <> ? AND DATA_TYPE = ? ";
SQLQuery query = baseDao.getSQLQuery(sql);
query.setParameter(0, tableName);
query.setParameter(1, defaultCollation);
query.setParameter(2, dataType);
query.setResultTransformer(Transformers.ALIAS_TO_ENTITY_MAP);
List<Map<String,Object>> list = query.list();
for(Map<String,Object> map : list){
String columnName = (String) map.get("columnName");
Integer length = (Integer) map.get("length");
String changeSql = String.format("ALTER TABLE [%s] ALTER COLUMN [%s] %s(%d) COLLATE %s",tableName,columnName,dataType,length,defaultCollation);
query = baseDao.getSQLQuery(changeSql);
query.executeUpdate();
}
}

可以使用下面sql查询出表中的所有列。

SELECT * FROM INFORMATION_SCHEMA.COLUMNS

前台可以让用户现在Excel中每一列对应的真实表的列。对应关系组织好之后,根据需要给临时表添加字段、修改数据等等,最后使用INSERT SELECT插入数据或修改数据。

编写sql的时候可能因为列名的不规范,导致sql语法错误。这时候需要在列名或表名前后添加中括号“[]”。Jaya使用String.format();比较方便。

使用OPENROWSET、Microsoft.ACE.OLEDB实现大数据量的高效导入的更多相关文章

  1. 大数据量.csv文件导入SQLServer数据库

    前几天拿到了一个400多M的.csv文件,在电脑上打开要好长时间,打开后里面的数据都是乱码.因此,做了一个先转码再导入数据库的程序.100多万条的数据转码+导入在本地电脑上花了4分钟,感觉效率还可以. ...

  2. .NET读取Excel数据,提示错误:未在本地计算机上注册“Microsoft.ACE.OLEDB.12.0”提供程序

    解决.NET读取Excel数据时,提示错误:未在本地计算机上注册“Microsoft.ACE.OLEDB.12.0”提供程序的操作: 1. 检查本机是否安装Office Access,如果未安装去去h ...

  3. 从Excel中导入数据时,提示“未在本地计算机上注册“Microsoft.ACE.OLEDB.12.0”提供程序”的解决办法

    注意,64位系统,用64位的补丁文件; https://www.cnblogs.com/A2008A/articles/2438962.html 操作系统:使用的是64位的Windows Server ...

  4. 在使用Access连接后获取数据--出现此类问题如何解决---未在本地计算机上注册“microsoft.ACE.oledb.12.0”提供程序解决办法

    转载:https://blog.csdn.net/yyzzhc999/article/details/79367114 using System; using System.Collections.G ...

  5. C#通过OLEDB导出大数据到Excel

    C#导出数据到Excel,基本有两种方法,一种方法是通过Microsoft.Office.Interop.Excel.Application,一行一列的写入Excel中:另一种方法是通过OLEDB,利 ...

  6. Microsoft.ACE.OLEDB.12.0 及其在 MSSQL中的使用

    1.Microsoft.ACE.OLEDB.12.0 简介 就是一个数据访问接口,用于在office文件和非office应用程序间传输数据.例如 Microsoft Office Access 201 ...

  7. Microsoft ACE OLEDB 12.0 数据库连接字符串

    Excel 97-2003 Provider=Microsoft.ACE.OLEDB.12.0;Data Source=c:\myFolder\myOldExcelFile.xls;Extended ...

  8. 未在本地计算机上注册“microsoft.ACE.oledb.12.0”提供程序

    这种错误的可能性有几种,比如: 1.没有安装数据访问组件,需要安装相应版本的数据访问组件: 2.没有安装相应版本的Office客户端,需要安装相应版本的Office客户端: 3.Microsoft.J ...

  9. 未在本地计算机上注册“microsoft.ACE.oledb.12.0”提供程序 解决方法

    最近在搞asp.net.今天在做数据库操作的时候,老发生错误,还以为是自己代码有问题,检查了好久都发现错误. 错误提示: 未在本地计算机上注册“microsoft.ACE.oledb.12.0”提供程 ...

随机推荐

  1. (Hibernate进阶)Hibernate系列——总结篇(九)

    这篇博文是hibernate系列的最后一篇,既然是最后一篇,我们就应该进行一下从头到尾,整体上的总结,将这个系列的内容融会贯通. 概念 Hibernate是一个对象关系映射框架,当然从分层的角度看,我 ...

  2. JS数组键值,数组合并,

    eg: var arr = [] arr.test = '测试'; arr.push(1); arr.push(2); arr.obj = '对象'; console.log(arr);// [ 1, ...

  3. 2016-12-14:通过static关键字,使用类成员函数作为回调函数

    #include <iostream> using namespace std; class Callee { public: void PrintInfo(int i) { cout & ...

  4. Chrome Dev Tools :成为更高效的开发人员

    原文出处 http://blog.jobbole.com/22065/ 实时CSS Style编辑 选择一个Dom,可以对Dom进行编辑和操作,实时修改Css Style, 同时CssStyle可以保 ...

  5. spring 注入静态变量

    import java.util.Iterator; import java.util.LinkedList; import javax.annotation.PostConstruct; impor ...

  6. CoIDE在STM32系列单片机中的使用实践

    这一段时间找到CoIDE,发现其真的挺好用,编辑界面比Keil功能强大.因此把实际操作过程记录下来. CoIDE  是CooCox专业打造的一款免费的ARMCortexMCU嵌入式集成开发环境(Int ...

  7. android第二天(项目的组成结构)

    1:src文件夹分析: helloWorld----src(源码文件夹) MainActivity:主界面类----gen(自动生成的源码文件夹) R.java:对应res文件夹 下面又包含三个内部类 ...

  8. Javascript数组函数库

    其实平时用的比较多的应该是push和pop,不过还是都记下来,以便后面使用. shift :删除原数组第一项,并返回删除元素的值:如果数组为空则返回undefined var a = [1,2,3,4 ...

  9. NRF51822之IIC(MEMS_LIS2DH12)

    在上篇介绍了OLED的II以写操作为主,没有进行读取操作.所以在现再补充读取的操作. 我在此以LIS2DH为例子 uint8_t temp; lis2dh_read_registers(LIS2DH_ ...

  10. PHP集成百度Ueditor 1.4.3

    下载安装 1.首先到官网下载最新版的UE1.4.3UE官方下载地址:http://ueditor.baidu.com/website/download.html#ueditor 这里我下载的是1.4. ...