ADO.NET(OleDb)读取Excel表格时的一个BUG
如果我们有例如以下一个Excel表格:
如今要使用C#程序读取其内容:
using System.Data.OleDb;
namespace Skyiv.Ben.Test
{
sealed class ExcelTest
{
static void Main()
{
try
{
using (OleDbConnection conn = new OleDbConnection("Provider=Microsoft.Jet.OLEDB.4.0;Extended Properties=\"Excel 8.0;HDR=yes\";Data Source=Std"))
{
conn.Open();
OleDbCommand comm = new OleDbCommand("SELECT [ID],[NAME] FROM [Sheet1$]", conn);
using (OleDbDataReader r = comm.ExecuteReader())
{
while (r.Read())
{
int id = Convert.ToInt32(r.GetValue(0));
string name = Convert.ToString(r.GetValue(1));
Console.WriteLine("{0}:\t{1}", id, name);
}
}
}
}
catch (Exception ex)
{
Console.WriteLine("错误: " + ex.Message);
}
}
}
}
该程序的执行结果例如以下:
看来在读取单元格“B3”时返回了“DBNull”,而不是正确的“1768”。
使用我的博客园发表的一篇随笔“数据库小工具(C#)”中给出的 OleDb.exe 查看了一下:
确实,该 Execl 表格中有 2 个“DBNull”值,再用该工具查看一下其结构:
发现其第一列“ID”的数据类型是“double”,第二列“NAME”的数据类型是“string”。
经分析。“DBNull”都出如今其数据类型与列的数据类型不相符的单元格中。
看来。问题的症结就在这里了。我们知道,Excel 表格并是不真正的数据库,不像真正的数据库一样每一个字段(列)都有一个特定的数据类型。而是由ADO.NET通过扫描该表格的开头几行来猜測其每一列的数据类型,这样。当某列中有些单元格的数据类型与该列数据类型不一致时。就出问题了。该单元格的值就变成的“DBNull”。
这个问题来源于我的实际工作。在工作中,须要分析一张业务部门提供的 Excel 表格中的数据,该表格有好几千个数据行。当中有些列绝大部分的值是数字型。但当中有一些数字存储为文本格式。而有些列绝大部分的值是字符型,但有少数单元格的值是数字。这样,我的分析程序就不能工作了。我眼下的解决方式是将该 Excel 表格另存为文本文件(制表符分隔),然后在 C# 程序中读取该文本文件。
另一种方法就是在 Excel 表格中选中整列。然后“将存为文本的数字转换为数字”。例如以下所看到的:
可是,我并没有找到一个简便的方法来“将数字转换为文本”。
不知在 ADO.NET 中有没有办法在不改变原始 Excel 表格的情况下。正确读取其列中有单元格的数据类型不一致的 Excel 表格中的数据?假设谁知道的话,恳请告诉我。谢谢。
不知道要通过什么途径向 Microsoft 报告这个 BUG ?
我觉得这个 BUG 的解决方式有两个:
1. 假设某一列被猜測为数字型的话,假设在该列中出现字符型的数据,假设该数据是存储为文本的数字,就直接转换为数字返回给调用者好了。
假设该数据不能转换为数字,能够返回“DBNull”,或者抛出异常。
假设某一列被猜測为字符型的话,仅仅要该列中的单元格不为空。就转换为字符型返回给调用者。
2. 在 ADO.NET 的 OleDb 连接串中提供一个属性强制指定 Excel 表格中的全部列的数据类型都为“string”,仅仅要单元格的内容不为空,就不返回“DBNull”,而返回“string”。然后由调用者自己使用 Convert.ToXXX() 方法转换到合适的数字类型。
不知大家以为然否?
ADO.NET(OleDb)读取Excel表格时的一个BUG的更多相关文章
- OLEDB读取EXCEL表格时,某些字段为空,怎么办?
转载:http://blog.sina.com.cn/s/blog_53864cba01011cbn.html 前些日子,写了一个Excel导入数据库的共同Batch,突然有一天发现当我修改Exc ...
- Python:读取Excel表格时出现的u'\u51c6’ 无法正确显示汉字
读取Excel后,想显示其中一行的元素,结果读出来是这样[u'\u51c6\u8003\u8bc1\u53f7', u'\u8003\u751f\u59d3\u540d'],始终不显示正常的汉字 依照 ...
- python2读取EXCEL表格内的数据时碰到的问题
一,今天在剥离自动化的测试数据时,发生了一个错误,错误显示读取不到某个单元格的数据. 因为我使用的是python2,正好那一个单元格出现的是中文汉字,再者通过查看报错日志,让我了解到错误的原因. di ...
- .Net读取Excel文件时丢失数据的问题 (转载)
相信很多人都试过通过OleDB读取Excel文件,这种方法效率十分高,只是有一点会让人十分头痛,就是当一列中既有混合型数据,又有纯数据时,往往容易丢失数据. 百度过后,改连接字符串 “HDR=YES; ...
- Java读取excel表格
Java读取excel表格 一般都是用poi技术去读取excel表格的,但是这个技术又是什么呢 什么是Apache POI? Apache POI是一种流行的API,它允许程序员使用Java程序创建, ...
- C#读取Excel表格中数据并返回datatable
在软件开发的过程中,经常用到从excel表格中读取数据作为数据源,以下整理了一个有效的读取excel表格的方法. DataTable GetDataTable(string tableName,str ...
- 读取Excel表格中数据原型
写下这篇博客来记录自己的工作,这部分功能是读取Excel表格中的数据,并通过c#中的datagridview控件将读取的数据显示出来.为了方便用户,我设计了一个read按钮,用户点击这个按钮,会弹出打 ...
- python使用xlrd读取excel数据时,整数变小数的解决办法
python使用xlrd读取excel数据时,整数变小数: 解决方法: 1.有个比较简单的就是在数字和日期的单元格内容前加上一个英文的逗号即可.如果数据比较多,也可以批量加英文逗号的前缀(网上都有方法 ...
- C# 读取Excel表格内容,以及NPOI的使用
在实际的开发中,我们可能需要读写word或者Excel的内容,在我开发的项目中,需要读取Excel的内容,并将相对应的内容存储到数据库中,这里简单跟大家分享一下,希望能够帮助一些人. 我相信在读写wo ...
随机推荐
- Opencascade 选择器算法
算法的阶段 该算法包括预处理和三个主要阶段. 使用深度优先搜索逐层遍历所有对象 . 预处理 计算平截头体及其主要特征的计算. 第一阶段 - 遍历第一级BVH树 在成功构建选择平截头体之后,算法开始遍历 ...
- C++静态全局变量和全局变量的区别
静态全局变量 非静态全局变量 存储方式 静态存储 静态存储 作用域 定义该变量的源文件内 所有源文件 解释: 共同点:全局变量(外部变量)的说明之前再冠以static 就构 成了静态的全局变量.全 ...
- RestTemplate-postForObject源码
参数: 请求路径, 请求参数, 返回类型, 扩展模板变量
- TWaver可视化编辑器的前世今生(二)3D编辑器
接着昨天的继续说哈. 作为一款高效.轻量.自带编辑功能小组件,TWaver Java在电信网管界一炮而红,在各大运营商的OSS,BSS,NMS系统中随处可见. 采用了TWaver图形组件的上海世博会监 ...
- sqlserver差异备份3117
1.出现错误"3117" 2.完整备份/选项/不对数据库执行任何操作 3.数据库显示"正在还原" 4.差异备份/选项/回滚 5.数据库完整备份与差异备份成功
- ie8兼容性
ie8下不支持css的nth-child()样式解决方法一:使用jQuery的nth-child()方法例:$(".ability-head-list ul li:nth-child(1) ...
- minGW64编译Qt
1.安装minGW64,设置bin目录到环境变量Path 2.cmd 到qt的Src目录 3.configure -debug-and-release -opensource -prefix &quo ...
- Luogu-P1020(导弹拦截)(DP,LIS ,二分优化)
Luogu-P1020(导弹拦截)(DP) 题意: 给n(n<=100000) 个数字,求最长不上升子序列的长度和最少的不上升子序列的个数. 分析: 第一问: 求最长不上升子序列有 O(n^2) ...
- IDEA下maven工程的classpath
IDEA开发maven项目,此工程的classpath就是指src/main/java,src/main/resources,src/main/webapp,假如在main文件夹下新建一个文件prop ...
- centos7 rsync+inotify软件实现集群服务的数据备份(一)
一.rsync软件的说明: 1.1 什么是rsync rsync是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件.它使用所谓的“Rsync演算法”来使本地和远程两个主机之间的文件达 ...