shanzm-2020年12月8日 23:48:11

0. 前言

以前基于 .NET 开发的程序,我一般都是使用NPOI操作Excel文件,

因为我的程序读取的是另外一个成品WMS导出的Excel文件(至于为什么不直接从数据库获取该WMS导出到Excel的数据,此中原因,一言难尽!),在使用NPOI读取Excel的时候,提示错误:

Initialisation of record 0x203(NumberRecord) left 4 bytes remaining still to be read.

StackOverFlow一个高赞答案就是升级NPOI版本,或使用Office Excel将Excel文件另存为,保存为新的Excel文件再使用NPOI读取该Excel文件。

虽已使用最新的NPOI,但是依旧出现该错误,让用户另存为不合适,但是我又尚未找到一个简单有效快速的处理方法。

考虑到服务器上已经安装的Office套件,所以使用Com组件的方法操作Excel文件,但是读取速度较慢。

最终尝试使用ADO .NET 中的OleDbConnection类读取Excel文件,读取速度,且相对方便,简单记录如下。


1. 使用NPOI库读取Excel文件

在.NET程序中需要操作Excel文件,不论xls格式还是xlsx格式都是可以使用NPOI

Nuget获取该扩展:

PM> Install-Package NPOI -Version 2.5.2

简单的一个示例,读取用户上传的Excel文件:

    /// <summary>
/// 读取Excel导入DataTable
/// </summary>
/// <param name="filepath">导入的文件路径(包括文件名)</ param>
/// <param name="sheetName">工作表名称</param>
/// <param name="isFirstRowColumn">第一行是否是DataTable的列 名</param>
/// <returns>DataTable</returns>
public static DataTable ExcelToDataTable(string filePath,string sheetName,bool isFirstRowColumn)
{
DataTable data = new DataTable();
FileStream fs;
int startRow = 0;
using (fs = new FileStream(filePath, FileMode.Open, FileAccess.Read))
{
try
{
IWorkbook workbook = filePath.Contains(".xlsx") ? (IWorkbook)new XSSFWorkbook(fs) :newHSSFWorkbook(fs);//xlsx使用XSSFWorkbook, xls使用HSSFWorkbokk
ISheet sheet = workbook.GetSheet(sheetName) ?? workbook.GetSheetAt(0);//如果没有找到指sheetName 对应的sheet,则尝试获取第一个sheet
if (sheet != null)
{
IRow firstrow = sheet.GetRow(0);//第一行
int firstCellNum = firstrow.FirstCellNum;// 行第一个cell的编号,从0开始
int lastCellNum = firstrow.LastCellNum; // 行最后一个cell的编号 即总的列数,(不忽略中间某 列空格)
if (isFirstRowColumn)//如果第一行是表格列头
{
for (int i = firstCellNum; i < lastCellNum; i++)
{
ICell cell = firstrow.GetCell(i);
if (cell != null)
{
string cellValue = cell.StringCellValue;
if (cellValue != null)
{
DataColumn column = new DataColumn(cellValue);
data.Columns.Add(column);
}
}
}
startRow = sheet.FirstRowNum + 1;
}
else
{
startRow = sheet.FirstRowNum;
}
//读数据行
int rowCont = sheet.LastRowNum;
for (int i = startRow; i <=rowCont; i++)
{
IRow row = sheet.GetRow(i);
DataRow dataRow = data.NewRow();
//判断需要读取的最后一行
if (row != null && (row.GetCell(row.FirstCellNum) != null && row.GetCel (rowFirstCellNum).ToString() != "合计") )
{
for (int j = row.FirstCellNum; j < lastCellNum; j++)
{
dataRow[j] = row.GetCell(j).ToString();
}
data.Rows.Add(dataRow);
}
else
{
break;
}
}
}
return data;
}
catch (Exception ex)
{
Debug.WriteLine("Exception: " + ex.Message);
return null;
}
finally
{
fs.Close();
fs.Dispose();
}
}
}

读取到Excel表格中的数据到DataTable 中,可以使用SqlBulkCopy批量插入的方式将DataTable数据存储到数据库表中,关于ADO .NET 针对SQL Server的批量插入的各种方法以及比较,可以参考文末给出的参考连接

简单示例如下:

        /// <summary>
/// 使用SqlBulkCopy将DataTable中的数据批量插入数据库中
/// 注意:DataTable中的列需要与数据库表中的列完全一致。
/// </summary>
/// <param name="conStr">数据库连接串</param>
/// <param name="dbTableName">数据库中对应的表名</param>
/// <param name="dtData">数据集</param>
public static void SqlBulkCopyInsert(string dbTableName, DataTable dataTable)
{
using (SqlBulkCopy sqlRevdBulkCopy = new SqlBulkCopy(connStr))//引用SqlBulkCopy
{
sqlRevdBulkCopy.DestinationTableName = dbTableName;//数据库中对应的表名
sqlRevdBulkCopy.NotifyAfter = dataTable.Rows.Count;//有几行数据
sqlRevdBulkCopy.WriteToServer(dataTable);//数据导入数据库
sqlRevdBulkCopy.Close();//关闭连接
}
}

2. 使用OleDbConnection

使用ADO .NET 中的OleDbConnection类连接查询。简单示例如下:

        /// <summary>
/// 读取Excel返回DataTable
/// </summary>
/// <param name="filePath">Excel文件路径</param>
/// <param name="tableName">Excel文件中Sheet名称</param>
/// <returns></returns>
public static DataSet ExcelToDataSet(string filePath, string tableName)
{
//获取文件扩展名
string strExtension = System.IO.Path.GetExtension(filePath);
OleDbConnection myConn = null;
switch (strExtension)
{
case ".xls":
myConn = new OleDbConnection("Provider=Microsoft.Jet.OLEDB.4.0;Data Source=" + filePath + ";" + "Extended Properties=\"Excel 8.0;HDR=yes;IMEX=1;\"");
break;
case ".xlsx":
myConn = new OleDbConnection("Provider=Microsoft.ACE.OLEDB.12.0;Data Source=" + filePath + ";" + "Extended Properties=\"Excel 12.0;HDR=yes;IMEX=1;\"");
//此连接可以操作.xls与.xlsx文件 (支持Excel2003 和 Excel2007 的连接字符串)
//"HDR=yes;"是说Excel文件的第一行是列名而不是数,"HDR=No;"正好与前面的相反。"IMEX=1 "如果列中的数据类型不一致,使用"IMEX=1"可必免数据类型冲突。
break;
default:
myConn = null;
break;
}
if (myConn == null)
{
return null;
}
string strCom = " SELECT * FROM [" + tableName + "$]";
myConn.Open();
//获取Excel指定Sheet表中的信息
OleDbDataAdapter myCommand = new OleDbDataAdapter(strCom, myConn);
DataSet ds;
ds = new DataSet();
myCommand.Fill(ds, tableName);
myConn.Close();
return ds.Tables[0];
}

使用OleDbConnection在本地测试没有问题,在发布部署在服务器后出现了一个异常:

未在本地计算机上注册“Microsoft.Jet.OLEDB.4.0”提供程序

解决方法:IIS-->应用程序池-->选中部署的项目右键-->高级设置-->启用32位应用程序-->True


3. 相关参考

基于.NET的程序读取Excel文件的解决方案的更多相关文章

  1. C#读取excel文件提示未在本地计算机上注册“Microsoft.ACE.OLEDB.12.0”提供程序

    错误描述: 在VS2010执行读取excel文件时,报错"未在本地计算机上注册"Microsoft.ACE.OLEDB.12.0"提供程序" 业务代码: //下 ...

  2. 项目一:第四天 1、快递员的条件分页查询-noSession,条件查询 2、快递员删除(逻辑删除) 3、基于Apache POI实现批量导入区域数据 a)Jquery OCUpload上传文件插件使用 b)Apache POI读取excel文件数据

    1. 快递员的条件分页查询-noSession,条件查询 2. 快递员删除(逻辑删除) 3. 基于Apache POI实现批量导入区域数据 a) Jquery OCUpload上传文件插件使用 b) ...

  3. .Net读取Excel文件时丢失数据的问题 (转载)

    相信很多人都试过通过OleDB读取Excel文件,这种方法效率十分高,只是有一点会让人十分头痛,就是当一列中既有混合型数据,又有纯数据时,往往容易丢失数据. 百度过后,改连接字符串 “HDR=YES; ...

  4. 读取Excel文件的两种方法

    第一种方法:传统方法,采用OleDB读取EXCEL文件, 优点:写法简单,缺点:服务器必须安有此组件才能用,不推荐使用 private DataSet GetConnect_DataSet2(stri ...

  5. PhpSpreadsheet如何读取excel文件

    PhpSpreadsheet如何读取excel文件 一.总结 一句话总结:万能的百度,直接搜代码就好,绝对有,毕竟github上面4000+的关注,说明很多人用了这个,使用照着demo倒是异常简单 二 ...

  6. 如何在C#中打开和读取EXCEL文件

    这篇文章向您展示如何在C#Windows Forms Application中使用ExcelDataReader,ExcelDataReader.DataSet打开和读取Excel文件.创建一个新的W ...

  7. C# 读取EXCEL文件的三种经典方法

    1.方法一:采用OleDB读取EXCEL文件: 把EXCEL文件当做一个数据源来进行数据的读取操作,实例如下: public DataSet ExcelToDS(string Path) { stri ...

  8. c# .Net :Excel NPOI导入导出操作教程之读取Excel文件信息及输出

    c# .Net :Excel NPOI导入导出操作教程之读取Excel文件信息及输出 using NPOI.HSSF.UserModel;using NPOI.SS.UserModel;using S ...

  9. ADO.NET 读取Excel文件,并作数据源

    项目中需要用的功能,贴上代码了. 需要注意的地方:配置Web.config的时候要注意版本问题! //若是在Web.config中配置数据源,如下 <add key="ExcelCon ...

随机推荐

  1. Python的ConfigParser模块读取ini配置文件 报错(持续更新总结)

    1.ConfigParser.MissingSection什么的错误巴拉巴拉一堆,其实根本上就是没有读到配置文件,然后我去检查了一遍路径,发现没有问题,我是将文件的路径作为一个字符串拼接好传到另一个专 ...

  2. C#设计模式——代理模式(Proxy Pattern)

    引言 在我们的生活中,经常会遇到需要什么东西,但是自己又不是很方便或者对方不是很方便,则就需要中间的一个代理人去解决.例如代购.在软件开发中,也会遇到这样的问题.有些对象有时候会由于网络或其他的障碍, ...

  3. MySQL数据库 | MySQL调优|MySQL底层原理|MySQL零基础新手教程

    MySQL数据库安装 一.Windows 环境下安装 A.下载 MySQL Select Operating System: Microsoft Windows 快捷下载:mysql-8.0.22-w ...

  4. 太妙了!Spring boot 整合 Mybatis Druid,还能配置监控?

    Spring boot 整合 Mybatis Druid并配置监控 添加依赖 <!--druid--> <dependency> <groupId>com.alib ...

  5. 如何用pdfFactory新建打印机并设置属性

    今天我们来讲一讲,在pdfFactory中如何去修改PDF文件打印页面的页边距.页面大小.页面清晰度等属性参数. pdfFactory是一款Windows平台上的虚拟打印机,在没有打印机可以安装的情况 ...

  6. 庐山真面目之四微服务架构Consul和Ocelot简单版本实现

    庐山真面目之四微服务架构Consul和Ocelot简单版本实现 一.简介      在上一篇文章<庐山真面目之三微服务架构Consul简单版本实现>中,我们已经探讨了如何搭建基于Consu ...

  7. objetive-C中属性变量和成员变量

    属性变量 @property和@synthesize可以自动生成某个类成员变量的存取方法. readwrite:这个属性是默认的情况,会自动生成存取器 assign:这个属性一般用来处理基础类型,比如 ...

  8. python selenium 时间搜索框查询和日期大小比较

    在做selenium自动化的时候遇到 时间搜索框查询(如下图)并比较查询结果是否在输入的时间之类. 首先,第一步要做的就是选择时间,并获取到所选时间的文本信息 如上图所示,获取到的时间搜索框并没有文本 ...

  9. java运算符与程序逻辑控制

    一.运算符 java中的运算符大致分为四种:数学运算符,关系运算符.逻辑运算符.位运算 1.数学运算符:即咱们平常说的加减乘除运算,这种运算是分先后顺序的,如果想要优先进行运算,建议加上小括号,使其运 ...

  10. Codeforces Round #669 (Div. 2) C. Chocolate Bunny 题解(交互)

    题目链接 题目大意 有一个长度为n的全排列,你可以询问2n次,要你经过这个2n次的询问后,求出这个全排列 询问定义为:输入"? i j"输出\(p_{i} mod p_{j}\) ...