C#_.net core 3.0自定义读取.csv文件数据_解决首行不是标题的问题_Linqtocsv改进
linqtocsv文件有不太好的地方就是:无法设置标题的行数,默认首行就是标题,这不是很尴尬吗? 并不是所有的csv文件严格写的首行是标题,下面全是数据,我接受的任务就是读取很多.csv报表数据,里面就有很多前几行是说明性内容,下面才是标题和数据。为了更好的解决这个问题,自己写吧...
本博客没有照搬linqtocsv全部源码,保留了主要功能,并对其优化,为我所用,哈哈...
下面是主要代码:
1-主文件CsvHelper:
这里在独自解析数据的时候,遇到了很多坑:
a-遇到数据含有分隔符的问题的解决办法,代码已经包含了
b-遇到了解析源文档数据时,未指定字符编码时,部分数据丢失导致csv文件个别行数据解析异常的问题,针对该问题,就是老老实实把读取文件时加了字符编码的参数进去,默认UTF-8。
using Microsoft.Extensions.Logging;
using PaymentAccountAPI.Helper;
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Reflection;
using System.Text; namespace PaymentAccountAPI.CSV
{
public class CsvHelper
{
/// <summary>
/// 日志
/// </summary>
private ILogger _Logger { get; set; } public CsvHelper(ILogger<CsvHelper> logger)
{
this._Logger = logger;
} public List<T> Read<T>(string filePath, CsvFileDescription fileDescription) where T : class, new()
{
List<T> tList = new List<T>( * ); T t = null;
int currentRawIndex = ; if (File.Exists(filePath))
{
using (StreamReader streamReader = new StreamReader(filePath, fileDescription.Encoding))
{
Dictionary<int, FieldMapper> fieldMapperDic = FieldMapper.GetModelFieldMapper<T>().ToDictionary(m => m.CSVTitleIndex);
string rawValue = null;
string[] rawValueArray = null;
PropertyInfo propertyInfo = null;
string propertyValue = null;
bool rawReadEnd = false; bool isExistSplitChart = false;
do
{
rawValue = streamReader.ReadLine(); //标题行
if (currentRawIndex > fileDescription.TitleRawIndex)
{
if (!string.IsNullOrEmpty(rawValue))
{
//替换字符串含有分隔符为{分隔符},最后再替换回来
if (rawValue.Contains("\""))
{
isExistSplitChart = true; int yhBeginIndex = ;
int yhEndIndex = ;
string yhText = null;
do
{
yhBeginIndex = StringHelper.GetIndexOfStr(rawValue, "\"", );
yhEndIndex = StringHelper.GetIndexOfStr(rawValue, "\"", );
yhText = rawValue.Substring(yhBeginIndex, (yhEndIndex - yhBeginIndex + ));
string newYHText = yhText.Replace("\"", "").Replace(fileDescription.SeparatorChar.ToString(), "{分隔符}");
rawValue = rawValue.Replace(yhText, newYHText);
} while (rawValue.Contains("\""));
} rawValueArray = rawValue.Split(fileDescription.SeparatorChar); t = new T();
foreach (var fieldMapper in fieldMapperDic)
{
propertyInfo = fieldMapper.Value.PropertyInfo;
propertyValue = rawValueArray[fieldMapper.Key - ];
if (!string.IsNullOrEmpty(propertyValue))
{
try
{
if (isExistSplitChart && propertyValue.Contains("{分隔符}"))
{
propertyValue = propertyValue.Replace("{分隔符}", fileDescription.SeparatorChar.ToString());
} TypeHelper.SetPropertyValue(t, propertyInfo.Name, propertyValue);
}
catch (Exception e)
{
this._Logger.LogWarning(e, $"第{currentRawIndex + 1}行数据{propertyValue}转换属性{propertyInfo.Name}-{propertyInfo.PropertyType.Name}失败!");
continue;
}
}
}
tList.Add(t);
}
else
{
rawReadEnd = true;
}
}
currentRawIndex++;
} while (rawReadEnd == false);
}
} return tList;
} public void WriteFile<T>(string path, List<T> tList, CsvFileDescription fileDescription) where T : class, new()
{
if (!string.IsNullOrEmpty(path))
{
string fileDirectoryPath = null;
if (path.Contains("\\"))
{
fileDirectoryPath = path.Substring(, path.LastIndexOf('\\'));
}
else
{
fileDirectoryPath = path.Substring(, path.LastIndexOf('/'));
}
if (!Directory.Exists(fileDirectoryPath))
{
Directory.CreateDirectory(fileDirectoryPath);
} int dataCount = tList.Count;
Dictionary<int, FieldMapper> fieldMapperDic = FieldMapper.GetModelFieldMapper<T>().ToDictionary(m => m.CSVTitleIndex);
int titleCount = fieldMapperDic.Keys.Max();
string[] rawValueArray = new string[titleCount];
StringBuilder rawValueBuilder = new StringBuilder();
string rawValue = null;
T t = null;
PropertyInfo propertyInfo = null;
int currentRawIndex = ;
int tIndex = ; using (StreamWriter streamWriter = new StreamWriter(path, false, fileDescription.Encoding))
{
do
{
try
{
rawValue = ""; #if DEBUG
if (currentRawIndex % == )
{
this._Logger.LogInformation($"已写入文件:{path},数据量:{currentRawIndex}");
}
#endif if (currentRawIndex >= fileDescription.TitleRawIndex)
{
//清空数组数据
for (int i = ; i < titleCount; i++)
{
rawValueArray[i] = "";
} if (currentRawIndex > fileDescription.TitleRawIndex)
{
t = tList[tIndex];
tIndex++;
}
foreach (var fieldMapperItem in fieldMapperDic)
{
//写入标题行
if (currentRawIndex == fileDescription.TitleRawIndex)
{
rawValueArray[fieldMapperItem.Key - ] = fieldMapperItem.Value.CSVTitle;
}
//真正的数据从标题行下一行开始写
else
{
propertyInfo = fieldMapperItem.Value.PropertyInfo;
object propertyValue = propertyInfo.GetValue(t);
string formatValue = null;
if (propertyValue != null)
{
if (propertyInfo.PropertyType is IFormattable && !string.IsNullOrEmpty(fieldMapperItem.Value.OutputFormat))
{
formatValue = ((IFormattable)propertyValue).ToString(fieldMapperItem.Value.OutputFormat, null);
}
else
{
formatValue = propertyValue.ToString();
} //如果属性值含有分隔符,则使用双引号包裹
if (formatValue.Contains(fileDescription.SeparatorChar.ToString()))
{
formatValue = $"\"{formatValue}\"";
}
rawValueArray[fieldMapperItem.Key - ] = formatValue;
}
}
}
rawValue = string.Join(fileDescription.SeparatorChar, rawValueArray);
}
rawValueBuilder.Append(rawValue + "\r\n");
}
catch (Exception e)
{
this._Logger.LogWarning(e, $"(异常)Excel第{currentRawIndex+1}行,数据列表第{tIndex + 1}个数据写入失败!rawValue:{rawValue}");
throw;
} currentRawIndex++;
} while (tIndex < dataCount);
streamWriter.Write(rawValueBuilder.ToString()); streamWriter.Close();
streamWriter.Dispose();
}
}
} }
}
2-CSV映射类特性:
using System; namespace PaymentAccountAPI.CSV
{
/// <summary>
/// Csv文件类特性标记
/// </summary>
[System.AttributeUsage(System.AttributeTargets.Field | System.AttributeTargets.Property, AllowMultiple = false)]
public class CsvColumnAttribute : System.Attribute
{
internal const int defaultTitleIndex = Int32.MaxValue;
/// <summary>
/// 标题
/// </summary>
public string Title { get; set; }
/// <summary>
/// 标题位置(从0开始)
/// </summary>
public int TitleIndex { get; set; }
/// <summary>
/// 字符输出格式(数字和日期类型需要)
/// </summary>
public string OutputFormat { get; set; } public CsvColumnAttribute()
{
Title = "";
TitleIndex = defaultTitleIndex;
OutputFormat = "";
} public CsvColumnAttribute(string title, int titleIndex, string outputFormat)
{
Title = title;
TitleIndex = titleIndex;
OutputFormat = outputFormat;
}
}
}
3-CSV文件描述信息类:
using System.Text; namespace PaymentAccountAPI.CSV
{
public class CsvFileDescription
{
public CsvFileDescription() : this()
{
}
public CsvFileDescription(int titleRawIndex) : this(',', titleRawIndex, Encoding.UTF8)
{
}
public CsvFileDescription(char separatorChar, int titleRawIndex, Encoding encoding)
{
this.SeparatorChar = separatorChar;
this.TitleRawIndex = titleRawIndex;
this.Encoding = encoding;
} /// <summary>
/// CSV文件字符编码
/// </summary>
public Encoding Encoding { get; set; } /// <summary>
/// 分隔符(默认为(,),也可以是其他分隔符如(\t))
/// </summary>
public char SeparatorChar { get; set; }
/// <summary>
/// 标题所在行位置(默认为0,没有标题填-1)
/// </summary>
public int TitleRawIndex { get; set; } }
}
4-映射类获取关系帮助类:
using System.Collections.Generic;
using System.Linq;
using System.Reflection; namespace PaymentAccountAPI.CSV
{
/// <summary>
/// 字段映射类
/// </summary>
public class FieldMapper
{
/// <summary>
/// 属性信息
/// </summary>
public PropertyInfo PropertyInfo { get; set; }
/// <summary>
/// 标题
/// </summary>
public string CSVTitle { get; set; }
/// <summary>
/// 标题下标位置
/// </summary>
public int CSVTitleIndex { get; set; }
/// <summary>
/// 字符输出格式(数字和日期类型需要)
/// </summary>
public string OutputFormat { get; set; } public static List<FieldMapper> GetModelFieldMapper<T>()
{
List<FieldMapper> fieldMapperList = new List<FieldMapper>(); List<PropertyInfo> tPropertyInfoList = typeof(T).GetProperties().ToList();
CsvColumnAttribute csvColumnAttribute = null;
foreach (var tPropertyInfo in tPropertyInfoList)
{
csvColumnAttribute = (CsvColumnAttribute)tPropertyInfo.GetCustomAttribute(typeof(CsvColumnAttribute));
if (csvColumnAttribute != null)
{
fieldMapperList.Add(new FieldMapper
{
PropertyInfo = tPropertyInfo,
CSVTitle = csvColumnAttribute.Title,
CSVTitleIndex = csvColumnAttribute.TitleIndex,
OutputFormat = csvColumnAttribute.OutputFormat
});
}
}
return fieldMapperList;
} } }
5-其他扩展类:
namespace PaymentAccountAPI.Helper
{
public class StringHelper
{
/// <summary>
/// 获取字符串中第strPosition个位置的str的下标
/// </summary>
/// <param name="text"></param>
/// <param name="str"></param>
/// <param name="strPosition"></param>
/// <returns></returns>
public static int GetIndexOfStr(string text, string str, int strPosition)
{
int strIndex = -; int currentPosition = ;
if (!string.IsNullOrEmpty(text) && !string.IsNullOrEmpty(str) && strPosition >= )
{
do
{
currentPosition++;
if (strIndex == -)
{
strIndex = text.IndexOf(str);
}
else
{
strIndex = text.IndexOf(str, strIndex + );
}
} while (currentPosition < strPosition);
} return strIndex;
}
}
}
最后就是将CsvHelper注入到单例中,就可以使用了...
C#_.net core 3.0自定义读取.csv文件数据_解决首行不是标题的问题_Linqtocsv改进的更多相关文章
- C#使用Linq to csv读取.csv文件数据
前言:今日遇到了一个需要读取CSV文件类型的EXCEL文档数据的问题,原本使用NPOI的解决方案直接读取文档数据,最后失败了,主要是文件的类型版本等信息不兼容导致.其他同事有使用linq to csv ...
- matlab读取csv文件数据并绘图
circle.m(画二维圆的函数) %该函数是画二维圆圈,输入圆心坐标和半径%rectangle()函数参数‘linewidth’修饰曲线的宽度%'edgecolor','r',edgecolor表示 ...
- python读取csv文件数据绘制图像,例子绘制天气每天最高最低气温气象图
- C#使用Linq to csv读取.csv文件数据2_处理含有非列名数据的方法(说明信息等)
第一篇博客为:https://www.cnblogs.com/lxhbky/p/11884474.html 本文主要是为了解决上面博客遗留的一个含有不规范数据的一种方法,目前暂时没有从包里发现可以从第 ...
- VB 读取csv文件数据
Public adoConn As New ADODB.Connection Private Sub csv() adoConn.ConnectionString = "Driver={Mi ...
- php 生成读取csv文件并解决中文乱码
csv其实是文本文件,但是里面的内容是利用逗号分隔的. 1. 生成csv文件 function new_csv($arr) { $string=""; foreach ($arr ...
- NET Core 2.0 自定义
ASP.NET Core 2.0 自定义 _ViewStart 和 _ViewImports 的目录位置 在 ASP.NET Core 里扩展 Razor 查找视图目录不是什么新鲜和困难的事情,但 _ ...
- ASP.NET Core 5.0 中读取Request中Body信息
ASP.NET Core 5.0 中读取Request中Body信息 记录一下如何读取Request中Body信息 public class ValuesController : Controller ...
- VB6.0 读取CSV文件
最近做了一个Upload文件的需求,文件的格式为CSV,读取文件的方法整理了一下,如下: 1.先写了一个读取CSV文件的Function: '读取CSV文件 '假设传入的参数strFile=C:\Do ...
随机推荐
- 同一个环境同时使用python2和python3的方法
1.首先安装好p2和p3,配置好环境变量.在CMD内执行python返回版本号,返回结果根据配置的环境变量而定,如果p2的环境变量配置在前面,则返回p2的版本号,反之则p3 2.然后把各版本目录下的p ...
- mysq5.7l的下载与配置
---恢复内容开始--- mysql是一个开源免费的数据库,它属于oracle公司 下载地址:www.oracle.com 页面移动到下面可以找到这几个选项 还是移动到下面 如果你要下载的不是那四样中 ...
- python3.6的安装及cx_oracle安装
一.创建所需目录mkdir -p /home/用户名/software/python3.6.1mkdir -p /home/用户名/priv/bydmkdir -p /home/用户名/priv/by ...
- informatica9.5.1后最一步出错(ICMD_10033,INFACMD_10053)
错误信息: OutPut : [ICMD_10033] Command [ping] failed with error [[INFACMD_10053] [Domain [Domain_rotkan ...
- Java 架构知识点整理
架构学习 1. Java 核心技术 1.1. 基础知识 1.1.1. 进制转换 1.1.2. 异常处理 1.1.3. List 分批代码 1.1.4. 字符串分割 1.1.5. 编码风格 1.2. 并 ...
- HanLP《自然语言处理入门》笔记--5.感知机模型与序列标注
笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP 5. 感知机分类与序列标注 第4章我们利用隐马尔可夫模型实现了第一个基于序列标注的 ...
- ROS与激光雷达入门-ROS中使用激光雷达(RPLIDAR)
激光雷达(RPLIDAR) 我这里用的是思岚(rplidar)A1,通过ros系统去驱动激光雷达,现在做了一个基本的入门. RPLIDAR是低成本的二维雷达解决方案,由SlamTec公司的RoboPe ...
- MOTS:多目标跟踪和分割论文翻译
MOTS:多目标跟踪和分割论文翻译 摘要: 本文将目前流行的多目标跟踪技术扩展到多目标跟踪与分割技术(MOTS).为了实现这个目标,我们使用半自动化的标注为两个现有的跟踪数据集创建了密集的像素级标注. ...
- golang学习笔记(一):包,变量,函数
欢迎访问我的博客和github! go 语言学习笔记第一弹,来自 gotour ,以后要常写笔记,把自己学习笔记记录下来,就算只是笔记也要多写. 好记性不如烂笔头,也要多锻炼自己的写作能力. 说实话, ...
- 使用 GitHub Actions 实现 Hexo 博客自动部署
一.Hexo 相关知识点 静态博客简单,但是发布博文时稍显麻烦,一般需要下面两步: hexo clean hexo g -d // 相当于 hexo g + hexo d 如果考虑到同步源文件,还需要 ...