银行业务-Excel文件的拆分逻辑
一、问题:
随着银行业务数据量的急剧增加,原始的人力统计数据已经不能满足要求,
需要开发一款可以实现自动化数据统计的系统平台,进行数据的采集、加工、过滤、统计、预测
其中数据采集方式又以【Excel】格式为人们所熟悉,那么如何把Excel表格的数据进行持久化 ?
二、分析:
首先,需要把实体的Excel文件映射到数据库中,就要对表格进行拆分
行维度:可以分为表头行、数据行,映射到数据库中就是两张表【头表、DTL表】,其中由于数据的特殊存在【DTL*表】
列维度:每一列都包含实际的数据信息,在行维度拆分的表中,指定表实际包含的数据列
三、实践:
(1)头表只有几个字段,设置列指定单元格下标即可【单位、时间、说明】
(2)为了在DTL表中的数据有实际意义,需要在DTL表中包含头表的列【每个表单独设置同样列的代价高】
(3)DTL表中的列只是单纯的数据列,指定列的长度和列的精度即可,单元格索引即可
(4)DTL*表为不能直接读取的列【在列名下,存在二级标题】,必须单独出来转置为DTL*表后进行数据的读取
(5)在配置模板的时候,如果Excel本身是倒置的,需配置转置属性以便正确读取数据
(6)DTL*表中的列配置的时候,需要配置循环属性,【此处有疑问】
(7)中心就是把文件包含的信息全部展开,把文件的维度降到【二维】
四、步骤详情:
1、新建模板
(1)新建模板,如果文件需要转置读取,配置转置属性
(2)配置模板标识、标识位置用于校验模板版本
2、配置头表
(1)新建头表
(2)配置头表包含的列【通常列单元格指定的是是具体的表格某一格下标,如A1、B3】
(3)如果在DTL表中需要添加头表列,需要在配置完其它表后,指定包含属性
3、配置DTL表
(1)新建DTL表,开始行到结束行为数据行,不包含文件的第一行说明
(2)配置列说明时,就是列的起始第一行的列说明,单元格指定为列【A、B】
(3)如果存在特殊行,那么配置一列,指定单元格为【@】,在特殊行配置里指定具体的读取内容所在单元格
4、配置DTL*表
(1)新建DTL*表,一般需要携带DTL表中的说明列信息,使信息有用
(2)如果说明列在DTL中配置了特殊行,还要在这里配置特殊行
(3)配置列时,如果该值需要循环就需要配置循环属性
(4)配置列时需要指定说明为一列,数据信息统一为一列
五、总结:
1、模板表生成的表后,在数据库中只有配置的列,和文件表格列无关,配置有几列就只有几列
2、上报数据读取时,向该表中循环插入数据,原则就是逐行插入
3、数据上报就是获取文件配置关联的模板,然后针对每一个模板的包含配置表进行数据的填充
4、适配的时候就是抓取文件包含的页签,进行页签匹配,匹配后查找页签对应的模板,获取配置的数表信息
5、使用配置表信息,从文件中抓取数据循环抓取数据到数据库对应的生成表中
6、头表的信息抓取就是读取单元格所在位置的值,插入数据库对应的头表中
7、DTL表数据抓取时,读取列配置的位置,取值插入对应的数据库表中
8、DTL*表的数据抓取时,需要在思想上转置,循环说明列,进行逐行的数据插入
9、表的拆分就是把信息进行展开,使每一行数据都包含明确的数据信息
银行业务-Excel文件的拆分逻辑的更多相关文章
- C#将一个excel工作表根据指定范围拆分为多个excel文件
C#将一个excel工作表根据指定范围拆分为多个excel文件 微软Excel没有提供直接的方法来拆分excel文件,因此要拆分一个excel文件最简单的方法可能就是手动剪切和粘贴了,除此之外,还有其 ...
- WPS 2019 多个sheet表拆分成独立的excel文件
参考: https://www.cnblogs.com/hackxiyu/p/8945975.html 场景:将多个sheet表拆分成独立的excel文件 一.安装VB工具: 默认情况下:wps -- ...
- excel多个sheet表拆分成独立的excel文件
一.问题: 公司做一个项目,给的用户上报文是一个包含多个sheet页的excel文件, 但是在实际处理报文数据的时候需要拆分excel文件为多个独立的报文excel文件 二.解决: (1)一个一个的复 ...
- C# 按部门拆分excel文件
按照所属部门不同将excel文件拆分成多个文件 string excel_path = @"G:\zhyue\backup\2018-08-01 读取腾讯邮箱接口-获取一个月内未接收到外部邮 ...
- 项目一:第四天 1、快递员的条件分页查询-noSession,条件查询 2、快递员删除(逻辑删除) 3、基于Apache POI实现批量导入区域数据 a)Jquery OCUpload上传文件插件使用 b)Apache POI读取excel文件数据
1. 快递员的条件分页查询-noSession,条件查询 2. 快递员删除(逻辑删除) 3. 基于Apache POI实现批量导入区域数据 a) Jquery OCUpload上传文件插件使用 b) ...
- 用python处理excel文件有多轻松?工作从未如此简单
最近需要频繁读写 excel 文件,想通过程序对 excel 文件进行自动化处理,发现使用 python 的 openpyxl 库进行 excel 文件读写实在太方便了,结构清晰,操作简单.本文对 o ...
- Python 操作 MS Excel 文件
利用 Python 对 Excel 文件进行操作需要使用第三方库: openpyxl,可执行 pip install openpyxl 进行安装 1. 导入 openpyxl 模块 导入 openpy ...
- NPOI操作EXCEL(四)——反射机制批量导出excel文件
前面我们已经实现了反射机制进行excel表格数据的解析,既然有上传就得有下载,我们再来写一个通用的导出方法,利用反射机制实现对系统所有数据列表的筛选结果导出excel功能. 我们来构想一下这样一个画面 ...
- 效率最高的Excel数据导入---(c#调用SSIS Package将数据库数据导入到Excel文件中【附源代码下载】) 转
效率最高的Excel数据导入---(c#调用SSIS Package将数据库数据导入到Excel文件中[附源代码下载]) 本文目录: (一)背景 (二)数据库数据导入到Excel的方法比较 ...
随机推荐
- Debian防御DDOS(简易版本)
DDOS攻击主要还是靠硬防,不过,对于一些小的骚扰,可以采用DDoS deflate+iptables的方法减轻. ========================================== ...
- python的进度条实现
进度条最主要的问题就是所有字符全部在同一行,而且可以修改.然而当执行print语句的时候,python会在打印完这个语句的同时,在结尾加上换行‘\n’,这就导致在控制台下一旦被print之后就无法修改 ...
- 【RabbitMQ】4、三种Exchange模式——订阅、路由、通配符模式
前两篇博客介绍了两种队列模式,这篇博客介绍订阅.路由和通配符模式,之所以放在一起介绍,是因为这三种模式都是用了Exchange交换机,消息没有直接发送到队列,而是发送到了交换机,经过队列绑定交换机到达 ...
- contOS 网络配置
设定VirtualBox虚拟网卡的IP地址(现在设定本地机器网卡IP 192.168.56.1 子网掩码255.255.255.0) 设置虚拟机中的网络设置 在虚拟机中选用host-only网络(注 ...
- jQuery UI 实例 – 切换(Toggle)
toggle()函数用于为每个匹配元素的click事件绑定轮流的处理函数. toggle()是一个特殊的事件函数,用于为匹配元素的click事件绑定多个事件处理函数.每次触发click事件时,togg ...
- BZOJ1042:[HAOI2008]硬币购物(DP,容斥)
Description 硬币购物一共有4种硬币.面值分别为c1,c2,c3,c4.某人去商店买东西,去了tot次.每次带di枚ci硬币,买si的价值的东西.请问每次有多少种付款方法. Input 第一 ...
- 解决windows7无法连接CentOS7系统中oracle问题:ORA-12514 TNS 监听程序当前无法识别
linux开启后终端按下面输入(容易忘记,记录下): [oracle@localhost ~]$ lsnrctl stop #先关闭监听服务 [oracle@localh ...
- Autoware 安装流程
1. 前言 最近一个项目采用Autoware的无人驾驶系统,在安装工控机的过程中,踩了不少坑,留下记录,造福后人. 相关的下载在我的百度网盘,大家自行下载.链接: https://pan.baidu. ...
- yii2视频教材
http://www.weixistyle.com/ http://www.imooc.com/learn/743
- PAT——1047. 编程团体赛
编程团体赛的规则为:每个参赛队由若干队员组成:所有队员独立比赛:参赛队的成绩为所有队员的成绩和:成绩最高的队获胜. 现给定所有队员的比赛成绩,请你编写程序找出冠军队. 输入格式: 输入第一行给出一个正 ...