使用NPOI读取Excel数据到DataTable
如今XML文件的存储格式大行其道,可是也不是适用于全部情况,非常多单位的数据交换还是使用Excel的形式。这就使得我们须要读取Excel内的数据。载入到程序中进行处理。可是如何有效率的读取,如何使程序保持健壮,这须要非常大的努力。
我们假设要写一个动态链接库会非常花费时间和精力。这就使得开源项目是个非常有效率的选择。
在各类关于Excel的开源项目中NPOI是中国的程序猿发起的。他的一大优点是直接处理Ole文件,用户不必安装Office。如今发展到2.0还能够自己主动推断Excel文件版本号,我们自己推断文件后缀名的方式不是非常准确(用户可能自己更改)。我认为对于读取文件这个是非常方便的一个功能!
不足之处:对于大文件的读取速度还是有些慢,做了下測试,载入20W数据。大约10+M的Excel文件大约须要16S。转化数据须要6S,这个略微有些慢。读取文件流的地方还应该能够优化。
好了,废话少说,一下是我自己写的一个使用NPOI读取Excel数据的帮助类
using System;
using System.Collections.Generic;
using System.Data;
using System.Globalization;
using System.IO;
using System.Linq;
using System.Text;
using System.Threading;
using NPOI.HSSF.UserModel;
using NPOI.SS.UserModel;
using NPOI.XSSF.UserModel; namespace Vevisoft.Excel.Core
{
/// <summary>
/// 使用NOPI读取Excel数据
/// </summary>
public class ExcelImportCore
{
private IWorkbook _workbook;
private string _filePath; public List<string> SheetNames { get; set; } public ExcelImportCore()
{
SheetNames = new List<string>();
//LoadFile(_filePath);
} #region Excel信息 /// <summary>
/// 获取Excel信息
/// </summary>
/// <param name="filePath"></param>
public List<string> LoadFile(string filePath)
{
var prevCulture = Thread.CurrentThread.CurrentCulture;
Thread.CurrentThread.CurrentCulture = CultureInfo.InvariantCulture;
var stopwatch = new System.Diagnostics.Stopwatch();
stopwatch.Start();
_filePath = filePath;
SheetNames = new List<string>();
using (var fs = new FileStream(filePath, FileMode.Open, FileAccess.Read, FileShare.ReadWrite))
{
_workbook = WorkbookFactory.Create(fs);
} stopwatch.Stop();
Console.WriteLine("ReadFile:" + stopwatch.ElapsedMilliseconds/1000 + "s"); return GetSheetNames();
} /// <summary>
/// 获取SHeet名称
/// </summary>
/// <returns></returns>
private List<string> GetSheetNames()
{
var count = _workbook.NumberOfSheets;
for (int i = 0; i < count; i++)
{
SheetNames.Add(_workbook.GetSheetName(i));
}
return SheetNames;
} #endregion #region 获取数据源 /// <summary>
/// 获取全部数据,全部sheet的数据转化为datatable。
/// </summary>
/// <param name="isFirstRowCoumn">是否将第一行作为列标题</param>
/// <returns></returns>
public DataSet GetAllTables(bool isFirstRowCoumn)
{
var stopTime = new System.Diagnostics.Stopwatch();
stopTime.Start();
var ds = new DataSet(); foreach (var sheetName in SheetNames)
{
ds.Tables.Add(ExcelToDataTable(sheetName, isFirstRowCoumn));
}
stopTime.Stop();
Console.WriteLine("GetData:" + stopTime.ElapsedMilliseconds/1000 + "S");
return ds;
} /// <summary>
/// 获取第<paramref name="idx"/>的sheet的数据
/// </summary>
/// <param name="idx">Excel文件的第几个sheet表</param>
/// <param name="isFirstRowCoumn">是否将第一行作为列标题</param>
/// <returns></returns>
public DataTable GetTable(int idx, bool isFirstRowCoumn)
{
if (idx >= SheetNames.Count || idx < 0)
throw new Exception("Do not Get This Sheet");
return ExcelToDataTable(SheetNames[idx], isFirstRowCoumn);
} /// <summary>
/// 获取sheet名称为<paramref name="sheetName"/>的数据
/// </summary>
/// <param name="sheetName">Sheet名称</param>
/// <param name="isFirstRowColumn">是否将第一行作为列标题</param>
/// <returns></returns>
public DataTable GetTable(string sheetName, bool isFirstRowColumn)
{
return ExcelToDataTable(sheetName, isFirstRowColumn);
} #endregion #region 方法 /// <summary>
/// 将excel中的数据导入到DataTable中
/// </summary>
/// <param name="sheetName">excel工作薄sheet的名称</param>
/// <param name="isFirstRowColumn">第一行是否是DataTable的列名</param>
/// <returns>返回的DataTable</returns>
public DataTable ExcelToDataTable(string sheetName, bool isFirstRowColumn)
{
ISheet sheet = null;
var data = new DataTable();
data.TableName = sheetName;
int startRow = 0;
try
{
sheet = sheetName != null ? _workbook.GetSheet(sheetName) : _workbook.GetSheetAt(0);
if (sheet != null)
{
var firstRow = sheet.GetRow(0);
if (firstRow == null)
return data;
int cellCount = firstRow.LastCellNum; //一行最后一个cell的编号 即总的列数
startRow = isFirstRowColumn ? sheet.FirstRowNum + 1 : sheet.FirstRowNum; for (int i = firstRow.FirstCellNum; i < cellCount; ++i)
{
//.StringCellValue;
var column = new DataColumn(Convert.ToChar(((int) 'A') + i).ToString());
if (isFirstRowColumn)
{
var columnName = firstRow.GetCell(i).StringCellValue;
column = new DataColumn(columnName);
}
data.Columns.Add(column);
} //最后一列的标号
int rowCount = sheet.LastRowNum;
for (int i = startRow; i <= rowCount; ++i)
{
IRow row = sheet.GetRow(i);
if (row == null) continue; //没有数据的行默认是null DataRow dataRow = data.NewRow();
for (int j = row.FirstCellNum; j < cellCount; ++j)
{
if (row.GetCell(j) != null) //同理,没有数据的单元格都默认是null
dataRow[j] = row.GetCell(j, MissingCellPolicy.RETURN_NULL_AND_BLANK).ToString();
}
data.Rows.Add(dataRow);
}
}
else throw new Exception("Don not have This Sheet"); return data;
}
catch (Exception ex)
{
Console.WriteLine("Exception: " + ex.Message);
return null;
}
} #endregion
}
}
调用的方法例如以下:
private void toolStripButton1_Click(object sender, EventArgs e)
{
var importCore = new ExcelImportCore();
var opdiag=new OpenFileDialog();
tabControl1.TabPages.Clear();
if (opdiag.ShowDialog() == DialogResult.OK)
{
importCore.LoadFile(opdiag.FileName);
var ds = importCore.GetAllTables(false);
//
for (int i = 0; i < importCore.SheetNames.Count; i++)
{
var tp=new TabPage {Text= Name = importCore.SheetNames[i]};
tabControl1.TabPages.Add(tp);
//加入数据源
var dgv=new DataGridView
{
//AutoGenerateColumns = false,
DataSource = ds.Tables[i],
Dock = DockStyle.Fill
};
tp.Controls.Add(dgv); }
}
}
使用NPOI读取Excel数据到DataTable的更多相关文章
- 读取Excel数据到DataTable
读取Excel数据到DataTable 代码 /// <summary> /// 获取指定路径.指定工作簿名称的Excel数据:取第一个sheet的数据 /// </summary& ...
- 使用NPOI读取Excel数据并写入SQLite
首先,我们来建一个数据库,我们就叫Hello.db(不一定是db后缀,你可以sqlite,sqlite3,db3)都可以作为识别,然后往里面建一个空的表格,如下图所示 然后建一个Excel表格,往表格 ...
- NPOI读取Excel数据应用
NPOI 是 POI 项目的 .NET 版本.使用 NPOI 你就可以在没有安装 Office 或者相应环境的机器上对 WORD/EXCEL 文档进行读写.NPOI是构建在POI 3.x版本之上的,它 ...
- .NET小笔记-NPOI读取excel内容到DataTable
下载比较新的NPOI组件支持excel2007以上的,把.dll添加引用 引入命名空间 using NPOI.HSSF.UserModel;using NPOI.SS.UserModel;using ...
- C#读取excel数据到datatable中
DataTable dtGBPatient = new DataTable(); string strConn;string excelName; //注意:把一个excel文件看做一个数据库,一个s ...
- NPOI读取Excel 数据 转。。。
public DataTable am_Decode() { DataTable table = new DataTable(); string[] strAscDataList = Direct ...
- Aspose.Cells 读取Excel数据到DataTable
C#代码: Workbook workbook = new Workbook(); workbook.Open(excelfile); Cells cells = workbook.Worksheet ...
- NPOI读取Excel遇到的坑
NPOI是POI的.NET版本.POI是用Java写成的库,能帮助用户在没有安装Office环境下读取Office2003-2007文件.NPOI在.NET环境下使用,能读写Excel/Word文件. ...
- NPOI操作excel之读取excel数据
NPOI 是 POI 项目的 .NET 版本.POI是一个开源的Java读写Excel.WORD等微软OLE2组件文档的项目. 一.下载引用 去NPOI官网http://npoi.codeplex. ...
随机推荐
- jquery的img的动态title换行
因业务需要,需要在图片悬浮的时候显示动态加载的title,如果图片的title为固定的可以使用以下方式换行: <img src="1.jpg" title="第一行 ...
- Vue.js—组件快速入门以及实例应用
上次我们学习了Vue.js的基础,并且通过综合的小实例进一步的熟悉了Vue.js的基础应用.今天我们就继续讲讲Vue.js的组件,更加深入的了解Vue,js的使用.首先我们先了解一下什么是Vue.js ...
- java 整型数组基本排序,冒泡,快速选择,插入,归并
在学java泛型,于是把排序拿来练练手了 import java.util.Arrays; public class GenericArraySort { public static void mai ...
- Filezilla账号密码都正确,但是连不上
显示的错误信息是:服务器发回了不可路由的地址.使用服务器地址代替. 之前一直用CuteFTP把ssm项目发送给客户服务器,最近学习大数据用Filezilla连通虚拟机,感觉Filezilla很直观.就 ...
- 深入理解java虚拟机_第二章_读书笔记
1.本章内容目录: 概述 运行时数据区域 程序计数器 java虚拟机栈 本地方法栈 java堆 方法区 运行时常量池 直接内存 HotSpot虚拟机对象探秘 对象的创建 对象的内存布局 对象的访问定位 ...
- 一起写框架-MVC框架-基础功能-Date类型数据绑定(七)
实现功能 表单请求传递的数据,格式为以下格式的日期时间数据. (1):yyyy-MM-dd hh:mm:ss (2):yyyy-MM-dd 执行方法可以使用Date类型接收. 实现思路 1.获得表单字 ...
- 五、VueJs 填坑日记之将接口用webpack代理到本地
上一篇博文,我们已经顺利的从cnodejs.org请求到了数据,但是大家可以注意到我们的/src/api/index.js的第一句就是: // 配置API接口地址 var root = 'https: ...
- db2中left()函数和right()函数对应oracle中的substr()函数
DB2 LEFT.RIGHT函数 语法:LEFT(ARG,LENGTH).RIGHT(ARG,LENGTH) LEFT.RIGHT函数返回ARG最左边.右边的LENGTH个字符串,ARG可以是CHA ...
- ASP.NET Core 认证与授权[6]:授权策略是怎么执行的?
在上一章中,详细介绍了 ASP.NET Core 中的授权策略,在需要授权时,只需要在对应的Controler或者Action上面打上[Authorize]特性,并指定要执行的策略名称即可,但是,授权 ...
- Less命名空间
Less命名空间 当我们拥有了大量选择器的时候,特别是团队协同开发时,如何保证选择器之间重名问题?如果你是 java 程序员或 C++ 程序员,我猜你肯定会想到命名空间 Namespaces. Les ...