Java读取批量Excel文件
1.首先基础知识:
原文链接:https://blog.csdn.net/baidu_39298625/article/details/105842725
一 :简介
开发中经常会设计到excel的处理,如导出Excel,导入Excel到数据库中,操作Excel目前有两个框架,一个是apache 的poi, 另一个是 Java Excel
Apache POI 简介是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对Microsoft Office(Excel、WORD、PowerPoint、Visio等)格式档案读和写的功能。POI为“Poor Obfuscation Implementation”的首字母缩写,意为“可怜的模糊实现”。
官方主页: http://poi.apache.org/index.html
API文档: http://poi.apache.org/apidocs/index.html
Java Excel是一开放源码项目,通过它Java开发人员可以读取Excel文件的内容、创建新的Excel文件、更新已经存在的Excel文件。jxl 由于其小巧 易用的特点, 逐渐已经取代了 POI-excel的地位, 成为了越来越多的java开发人员生成excel文件的首选。
由于apache poi 在项目中用的比较多,本篇博客只讲解apache poi,不讲jxl
二:Apache POI常用的类
HSSF - 提供读写Microsoft Excel XLS格式档案的功能。
XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。
HWPF - 提供读写Microsoft Word DOC97格式档案的功能。
XWPF - 提供读写Microsoft Word DOC2003格式档案的功能。
HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
HDGF - 提供读Microsoft Visio格式档案的功能。
HPBF - 提供读Microsoft Publisher格式档案的功能。
HSMF - 提供读Microsoft Outlook格式档案的功能。
在开发中我们经常使用HSSF用来操作Excel处理表格数据,对于其它的不经常使用。
HSSF 是Horrible SpreadSheet Format的缩写,通过HSSF,你可以用纯Java代码来读取、写入、修改Excel文件。HSSF 为读取操作提供了两类API:usermodel和eventusermodel,即“用户模型”和“事件-用户模型”。
常用的类和方法
HSSFWorkbook :工作簿,代表一个excel的整个文档
- HSSFWorkbook(); // 创建一个新的工作簿
- HSSFWorkbook(InputStream inputStream); // 创建一个关联输入流的工作簿,可以将一个excel文件封装成工作簿
- HSSFSheet createSheet(String sheetname); 创建一个新的Sheet
- HSSFSheet getSheet(String sheetName); 通过名称获取Sheet
- HSSFSheet getSheetAt(int index); // 通过索引获取Sheet,索引从0开始
- HSSFCellStyle createCellStyle(); 创建单元格样式
- int getNumberOfSheets(); 获取sheet的个数
- setActiveSheet(int index); 设置默认选中的工作表
- write();
- write(File newFile);
- write(OutputStream stream);
HSSFSheet:工作表
- HSSFRow createRow(int rownum); 创建新行,需要指定行号,行号从0开始
- HSSFRow getRow(int index); 根据索引获取指定的行
- int addMergedRegion(CellRangeAddress region); 合并单元格
- CellRangeAddress(int firstRow, int lastRow, int firstCol, int lastCol); 单元格范围, 用于合并单元格,需要指定要合并的首行、最后一行、首列、最后一列。
- autoSizeColumn(int column); 自动调整列的宽度来适应内容
- getLastRowNum(); 获取最后的行的索引,没有行或者只有一行的时候返回0
- setColumnWidth(int columnIndex, int width); 设置某一列的宽度,width=字符个数 * 256,例如20个字符的宽度就是20 * 256
HSSFRow :行
- HSSFCell createCell(int column); 创建新的单元格
- HSSFCell setCell(shot index);
- HSSFCell getCell(shot index);
- setRowStyle(HSSFCellStyle style); 设置行样式
- short getLastCellNum(); 获取最后的单元格号,如果单元格有第一个开始算,lastCellNum就是列的个数
- setHeightInPoints(float height); 设置行的高度
HSSFCell:单元格
- setCellValue(String value); 设置单元格的值
- setCellType(); 设置单元格类型,如 字符串、数字、布尔等
- setCellStyle(); 设置单元格样式
- String getStringCellValue(); 获取单元格中的字符串值
- setCellStyle(HSSFCellStyle style); 设置单元格样式,例如字体、加粗、格式化
- setCellFormula(String formula); 设置计算公式,计算的结果作为单元格的值,也提供了异常常用的函数,如求和"sum(A1,C1)"、日期函数、字符串相关函数、CountIf和SumIf函数、随机数函数等
HSSFCellStyle :单元格样式
- setFont(Font font); 为单元格设置字体样式
- setAlignment(HorizontalAlignment align); // 设置水平对齐方式
- setVerticalAlignment(VerticalAlignment align); // 设置垂直对齐方式
- setFillPattern(FillPatternType fp);
- setFillForegroundColor(short bg); 设置前景色
- setFillBackgroundColor(short bg); 设置背景颜色
HSSFFont:字体
- setColor(short color); // 设置字体颜色
- setBold(boolean bold); // 设置是否粗体
- setItalic(boolean italic); 设置倾斜
- setUnderline(byte underline); 设置下划线
HSSFName:名称
- HSSFDataFormat :日期格式化
- HSSFHeader : Sheet的头部
- HSSFFooter :Sheet的尾部
- HSSFDateUtil :日期工具
- HSSFPrintSetup :打印设置
- HSSFErrorConstants:错误信息表
2. 简单实现一个Excel工具类,可以修改引用
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory; import java.io.File;
import java.io.FileInputStream;
import java.util.*; public class ExcelUtil { private static final Logger logger = LoggerFactory.getLogger(ExcelUtil.class); private static final String XLS = ".xls";
private static final String XLSX = ".xlsx"; /**
* 根据文件后缀获取对应Workbook对象
* @param filePath
* @param fileType
* @return
*/
public static Workbook getWorkbook(String filePath,String fileType){
Workbook workbook = null;
FileInputStream fileInputStream = null;
try{
File excelFile = new File(filePath);
if(!excelFile.exists()){
logger.info(filePath+"文件不存在");
return null;
}
fileInputStream = new FileInputStream(excelFile);
if(fileType.equalsIgnoreCase(XLS)){
workbook = new HSSFWorkbook(fileInputStream);
}else if(fileType.equalsIgnoreCase(XLSX)){
workbook = new XSSFWorkbook(fileInputStream);
}
}catch (Exception e){
logger.error("获取文件失败",e);
}finally {
try {
if (null != fileInputStream) {
fileInputStream.close();
}
} catch (Exception e) {
logger.error("关闭数据流出错!错误信息:" , e);
return null;
}
}
return workbook;
} public static List<Object> readFolder(String filePath){
int fileNum = 0;
File file = new File(filePath);
List<Object> returnList = new ArrayList<>();
List<Map<String,String>> resultList = new ArrayList<>();
if (file.exists()) {
File[] files = file.listFiles();
for (File file2 : files) {
if (file2.isFile()) {
resultList = readExcel(file2.getAbsolutePath());
returnList.add(resultList);
fileNum++;
}
}
} else {
logger.info("文件夹不存在");
return null;
}
logger.info("共有文件:"+fileNum);
return returnList;
} /**
* 批量读取Excel文件,返回数据对象
* @param filePath
* @return
*/
public static List<Map<String,String>> readExcel(String filePath){
Workbook workbook = null;
List<Map<String,String>> resultList = new ArrayList<>();
try{
String fileType = filePath.substring(filePath.lastIndexOf("."));
workbook = getWorkbook(filePath,fileType);
if(workbook == null){
logger.info("获取workbook对象失败");
return null;
}
resultList = analysisExcel(workbook);
return resultList;
}catch (Exception e){
logger.error("读取Excel文件失败"+filePath+"错误信息",e);
return null;
}finally {
try {
if (null != workbook) {
workbook.close();
}
} catch (Exception e) {
logger.error("关闭数据流出错!错误信息:" , e);
return null;
} }
} /**
* 解析Excel文件,返回数据对象
* @param workbook
* @return
*/
public static List<Map<String,String>> analysisExcel(Workbook workbook){
List<Map<String,String>> dataList = new ArrayList<>();
int sheetCount = workbook.getNumberOfSheets();//或取一个Excel中sheet数量
for(int i = 0 ; i < sheetCount ; i ++){
Sheet sheet = workbook.getSheetAt(i); if(sheet == null){
continue;
}
int firstRowCount = sheet.getFirstRowNum();//获取第一行的序号
Row firstRow = sheet.getRow(firstRowCount);
int cellCount = firstRow.getLastCellNum();//获取列数 List<String> mapKey = new ArrayList<>(); //获取表头信息,放在List中备用
if(firstRow == null){
logger.info("解析Excel失败,在第一行没有读取到任何数据!");
}else {
for (int i1 = 0; i1 < cellCount; i1++) {
mapKey.add(firstRow.getCell(i1).toString());
}
} //解析每一行数据,构成数据对象
int rowStart = firstRowCount + 1;
int rowEnd = sheet.getPhysicalNumberOfRows();
for(int j = rowStart ; j < rowEnd ; j ++){
Row row = sheet.getRow(j);//获取对应的row对象 if(row == null){
continue;
} Map<String,String> dataMap = new HashMap<>();
//将每一行数据转化为一个Map对象
dataMap = convertRowToData(row,cellCount,mapKey);
dataList.add(dataMap);
}
}
return dataList;
} /**
* 将每一行数据转化为一个Map对象
* @param row 行对象
* @param cellCount 列数
* @param mapKey 表头Map
* @return
*/
public static Map<String,String> convertRowToData(Row row,int cellCount,List<String> mapKey){
if(mapKey == null){
logger.info("没有表头信息");
return null;
}
Map<String,String> resultMap = new HashMap<>();
Cell cell = null;
for(int i = 0 ; i < cellCount ; i ++){
cell = row.getCell(i);
if(cell == null){
resultMap.put(mapKey.get(i),"");
}else {
resultMap.put(mapKey.get(i),getCellVal(cell));
}
}
return resultMap;
} /**
* 获取单元格的值
* @param cel
* @return
*/
public static String getCellVal(Cell cel) {
if(cel.getCellType() == Cell.CELL_TYPE_STRING) {
return cel.getRichStringCellValue().getString();
}
if(cel.getCellType() == Cell.CELL_TYPE_NUMERIC) {
return cel.getNumericCellValue() + "";
}
if(cel.getCellType() == Cell.CELL_TYPE_BOOLEAN) {
return cel.getBooleanCellValue() + "";
}
if(cel.getCellType() == Cell.CELL_TYPE_FORMULA) {
return cel.getCellFormula() + "";
}
return cel.toString();
} public static void main(String[] args) {
//读取文件夹,批量解析Excel文件
System.out.println("--------------------读取文件夹,批量解析Excel文件-----------------------");
List<Object> returnList = readFolder("C:\\Users\\Administrator\\Desktop\\ExcelTest");
for(int i = 0 ; i < returnList.size() ; i ++){
List<Map<String,String>> maps = (List<Map<String,String>>)returnList.get(i);
for(int j = 0 ; j < maps.size() ; j ++){
System.out.println(maps.get(j).toString());
}
System.out.println("--------------------手打List切割线-----------------------");
} //读取单个文件
System.out.println("--------------------读取并解析单个文件-----------------------");
List<Map<String,String>> maps = readExcel("C:\\Users\\Administrator\\Desktop\\ExcelTest\\学生表.xlsx");
for(int j = 0 ; j < maps.size() ; j ++){
System.out.println(maps.get(j).toString());
} }
Java读取批量Excel文件的更多相关文章
- java - 读取,导出 excel文件数据
首先需下载poi java包,添加至构建路径, 写处理方法: import java.io.FileInputStream;import java.io.FileOutputStream;import ...
- java上传excel文件及解析
java上传excel文件及解析 CreateTime--2018年3月5日16:25:14 Author:Marydon 一.准备工作 1.1 文件上传插件:swfupload: 1.2 文件上 ...
- POI读取/写入Excel文件
import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io ...
- java读取大容量excel之二(空格、空值问题)
最近在项目中发现,对于Excel2007(底层根本是xml) ,使用<java读取大容量excel之一>中的方式读取,若待读取的excel2007文件中某一列是空值,(注意,所谓的空值是什 ...
- 根据NPOI 读取一个excel 文件的多个Sheet
大家都知道NPOI组件可以再你本地没有安装office的情况下来 读取,创建excel文件.但是大家一般都是只默认读取一个excel文件的第一个sheet.那么如果要读取一个excel 的所有shee ...
- java读取 500M 以上文件,java读取大文件
java 读取txt,java读取大文件 设置缓存大小BUFFER_SIZE ,Config.tempdatafile是文件地址 来源博客http://yijianfengvip.blog.163.c ...
- Java入门开发POI读取导入Excel文件
Apache POI是Apache开发的开源的跨平台的 Java API,提供API给Java程序对Microsoft Office格式档案进行各种操作. POI中Excel操作很简单,主要类有 HS ...
- java读取大容量excel之一
最近在用poi读取大容量excel,发现只要是excel文件大于2M左右,便会出现OOM(out of memory),经过查询得知,原来poi读取excel的原理是如下: org.apache.po ...
- java代码将excel文件中的内容列表转换成JS文件输出
思路分析 我们想要把excel文件中的内容转为其他形式的文件输出,肯定需要分两步走: 1.把excel文件中的内容读出来: 2.将内容写到新的文件中. 举例 一张excel表中有一个表格: 我们需要将 ...
随机推荐
- 【进阶】uniapp复现微信相册功能之【图视频编辑 + 压缩】
基于uniapp + vue实现微信相册,在实现了微信相册的基础上增加以下功能 1: 图片编辑 2: 视频编辑 3: 文件压缩 技术实现 开发环境:HbuilderX + nodejs 技术框架:un ...
- IDEA中springboot项目添加yml格式配置文件
1.先创建application.properties 文件,在resources文件夹,右键 new -> Resource Bundle 如下图所示,填写名称 2.生成如下图所示文件 3. ...
- 【LeetCode】447. Number of Boomerangs 解题报告(Java & Python)
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 日期 [LeetCode] 题目地址:https:/ ...
- 【九度OJ】题目1078:二叉树遍历 解题报告
[九度OJ]题目1078:二叉树遍历 解题报告 标签(空格分隔): 九度OJ http://ac.jobdu.com/problem.php?pid=1078 题目描述: 二叉树的前序.中序.后序遍历 ...
- 初识JavaScript变量
一.什么是变量? 变量即变化的量,在JS中变量是松散类型的,可以用来保存任何数据类型.把数据取个名字,放在内存中,就称之为变量! 通过变量名可以取到对应数据 二.为什么使用变量? 程序:代码的集合,一 ...
- linux 开启和关闭防火墙
Ubuntu #查看防火墙状态 sudo ufw status #开启防火墙 sudo ufw enable #关闭防火墙 sudo ufw disable CentOs #查看防火墙状态 syste ...
- GDB调试-从入门到实践
你好,我是雨乐! 在上篇文章中,我们分析了线上coredump产生的原因,其中用到了coredump分析工具gdb,这几天一直有读者在问,能不能写一篇关于gdb调试方面的文章,今天借助此文,分享一些工 ...
- AWS修改RDS时区
查看 RDS 当前时区 默认情况下,AWS 的 RDS 采用的是 UTC 时间.而我们地区一般位于东八区,因此我们本地的时间是 UTC+8. 连接到 RDS 上,查询当前实例的时区. show var ...
- JMeter_csv文件参数化
CSV Data Set Config 可以从指定的文件中一行一行的提取文本内容,每行的数据通过分隔符拆解,并与变量名一一对应,就可以供取样器引用了. 所以在配置数据时,我们需要把参数化的数据进行分行 ...
- [ vue ] Quasar封装q-dialog组件,在外层实现弹出框的开启和关闭
场景描述: 见:https://www.cnblogs.com/remly/p/12981582.html 具体实现: <!-- 父组件 --> <template> < ...