Java读取批量Excel文件总结

1.首先基础知识:

原文链接:https://blog.csdn.net/baidu_39298625/article/details/105842725

一 :简介

开发中经常会设计到excel的处理,如导出Excel,导入Excel到数据库中,操作Excel目前有两个框架,一个是apache 的poi, 另一个是 Java Excel

Apache POI 简介是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对Microsoft Office(Excel、WORD、PowerPoint、Visio等)格式档案读和写的功能。POI为“Poor Obfuscation Implementation”的首字母缩写,意为“可怜的模糊实现”。

官方主页: http://poi.apache.org/index.html

API文档: http://poi.apache.org/apidocs/index.html

Java Excel是一开放源码项目,通过它Java开发人员可以读取Excel文件的内容、创建新的Excel文件、更新已经存在的Excel文件。jxl 由于其小巧 易用的特点, 逐渐已经取代了 POI-excel的地位, 成为了越来越多的java开发人员生成excel文件的首选。

由于apache poi 在项目中用的比较多,本篇博客只讲解apache poi,不讲jxl

二:Apache POI常用的类

HSSF - 提供读写Microsoft Excel XLS格式档案的功能。

XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。

HWPF - 提供读写Microsoft Word DOC97格式档案的功能。

XWPF - 提供读写Microsoft Word DOC2003格式档案的功能。

HSLF - 提供读写Microsoft PowerPoint格式档案的功能。

HDGF - 提供读Microsoft Visio格式档案的功能。

HPBF - 提供读Microsoft Publisher格式档案的功能。

HSMF - 提供读Microsoft Outlook格式档案的功能。

在开发中我们经常使用HSSF用来操作Excel处理表格数据,对于其它的不经常使用。

HSSF 是Horrible SpreadSheet Format的缩写,通过HSSF,你可以用纯Java代码来读取、写入、修改Excel文件。HSSF 为读取操作提供了两类API:usermodel和eventusermodel,即“用户模型”和“事件-用户模型”。

常用的类和方法

HSSFWorkbook :工作簿,代表一个excel的整个文档

  • HSSFWorkbook(); // 创建一个新的工作簿
  • HSSFWorkbook(InputStream inputStream); // 创建一个关联输入流的工作簿,可以将一个excel文件封装成工作簿
  • HSSFSheet createSheet(String sheetname); 创建一个新的Sheet
  • HSSFSheet getSheet(String sheetName); 通过名称获取Sheet
  • HSSFSheet getSheetAt(int index); // 通过索引获取Sheet,索引从0开始
  • HSSFCellStyle createCellStyle(); 创建单元格样式
  • int getNumberOfSheets(); 获取sheet的个数
  • setActiveSheet(int index); 设置默认选中的工作表
  • write();
  • write(File newFile);
  • write(OutputStream stream);

HSSFSheet:工作表

  • HSSFRow createRow(int rownum); 创建新行,需要指定行号,行号从0开始
  • HSSFRow getRow(int index); 根据索引获取指定的行
  • int addMergedRegion(CellRangeAddress region); 合并单元格
  • CellRangeAddress(int firstRow, int lastRow, int firstCol, int lastCol); 单元格范围, 用于合并单元格,需要指定要合并的首行、最后一行、首列、最后一列。
  • autoSizeColumn(int column); 自动调整列的宽度来适应内容
  • getLastRowNum(); 获取最后的行的索引,没有行或者只有一行的时候返回0
  • setColumnWidth(int columnIndex, int width); 设置某一列的宽度,width=字符个数 * 256,例如20个字符的宽度就是20 * 256

HSSFRow :行

  • HSSFCell createCell(int column); 创建新的单元格
  • HSSFCell setCell(shot index);
  • HSSFCell getCell(shot index);
  • setRowStyle(HSSFCellStyle style); 设置行样式
  • short getLastCellNum(); 获取最后的单元格号,如果单元格有第一个开始算,lastCellNum就是列的个数
  • setHeightInPoints(float height); 设置行的高度

HSSFCell:单元格

  • setCellValue(String value); 设置单元格的值
  • setCellType(); 设置单元格类型,如 字符串、数字、布尔等
  • setCellStyle(); 设置单元格样式
  • String getStringCellValue(); 获取单元格中的字符串值
  • setCellStyle(HSSFCellStyle style); 设置单元格样式,例如字体、加粗、格式化
  • setCellFormula(String formula); 设置计算公式,计算的结果作为单元格的值,也提供了异常常用的函数,如求和"sum(A1,C1)"、日期函数、字符串相关函数、CountIf和SumIf函数、随机数函数等

HSSFCellStyle :单元格样式

  • setFont(Font font); 为单元格设置字体样式
  • setAlignment(HorizontalAlignment align); // 设置水平对齐方式
  • setVerticalAlignment(VerticalAlignment align); // 设置垂直对齐方式
  • setFillPattern(FillPatternType fp);
  • setFillForegroundColor(short bg); 设置前景色
  • setFillBackgroundColor(short bg); 设置背景颜色

HSSFFont:字体

  • setColor(short color); // 设置字体颜色
  • setBold(boolean bold); // 设置是否粗体
  • setItalic(boolean italic); 设置倾斜
  • setUnderline(byte underline); 设置下划线

HSSFName:名称

  • HSSFDataFormat :日期格式化
  • HSSFHeader : Sheet的头部
  • HSSFFooter :Sheet的尾部
  • HSSFDateUtil :日期工具
  • HSSFPrintSetup :打印设置
  • HSSFErrorConstants:错误信息表

2. 简单实现一个Excel工具类,可以修改引用

import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.apache.poi.xssf.usermodel.XSSFWorkbook; import org.slf4j.Logger; import org.slf4j.LoggerFactory; import java.io.File; import java.io.FileInputStream; import java.util.*; public class ExcelUtil { private static final Logger logger = LoggerFactory.getLogger(ExcelUtil.class); private static final String XLS = ".xls"; private static final String XLSX = ".xlsx"; /** * 根据文件后缀获取对应Workbook对象 * @param filePath * @param fileType * @return */ public static Workbook getWorkbook(String filePath,String fileType){ Workbook workbook = null; FileInputStream fileInputStream = null; try{ File excelFile = new File(filePath); if(!excelFile.exists()){ logger.info(filePath+"文件不存在"); return null; } fileInputStream = new FileInputStream(excelFile); if(fileType.equalsIgnoreCase(XLS)){ workbook = new HSSFWorkbook(fileInputStream); }else if(fileType.equalsIgnoreCase(XLSX)){ workbook = new XSSFWorkbook(fileInputStream); } }catch (Exception e){ logger.error("获取文件失败",e); }finally { try { if (null != fileInputStream) { fileInputStream.close(); } } catch (Exception e) { logger.error("关闭数据流出错!错误信息:" , e); return null; } } return workbook; } public static List<Object> readFolder(String filePath){ int fileNum = 0; File file = new File(filePath); List<Object> returnList = new ArrayList<>(); List<Map<String,String>> resultList = new ArrayList<>(); if (file.exists()) { File[] files = file.listFiles(); for (File file2 : files) { if (file2.isFile()) { resultList = readExcel(file2.getAbsolutePath()); returnList.add(resultList); fileNum++; } } } else { logger.info("文件夹不存在"); return null; } logger.info("共有文件:"+fileNum); return returnList; } /** * 批量读取Excel文件,返回数据对象 * @param filePath * @return */ public static List<Map<String,String>> readExcel(String filePath){ Workbook workbook = null; List<Map<String,String>> resultList = new ArrayList<>(); try{ String fileType = filePath.substring(filePath.lastIndexOf(".")); workbook = getWorkbook(filePath,fileType); if(workbook == null){ logger.info("获取workbook对象失败"); return null; } resultList = analysisExcel(workbook); return resultList; }catch (Exception e){ logger.error("读取Excel文件失败"+filePath+"错误信息",e); return null; }finally { try { if (null != workbook) { workbook.close(); } } catch (Exception e) { logger.error("关闭数据流出错!错误信息:" , e); return null; } } } /** * 解析Excel文件,返回数据对象 * @param workbook * @return */ public static List<Map<String,String>> analysisExcel(Workbook workbook){ List<Map<String,String>> dataList = new ArrayList<>(); int sheetCount = workbook.getNumberOfSheets();//或取一个Excel中sheet数量 for(int i = 0 ; i < sheetCount ; i ++){ Sheet sheet = workbook.getSheetAt(i); if(sheet == null){ continue; } int firstRowCount = sheet.getFirstRowNum();//获取第一行的序号 Row firstRow = sheet.getRow(firstRowCount); int cellCount = firstRow.getLastCellNum();//获取列数 List<String> mapKey = new ArrayList<>(); //获取表头信息,放在List中备用 if(firstRow == null){ logger.info("解析Excel失败,在第一行没有读取到任何数据!"); }else { for (int i1 = 0; i1 < cellCount; i1++) { mapKey.add(firstRow.getCell(i1).toString()); } } //解析每一行数据,构成数据对象 int rowStart = firstRowCount + 1; int rowEnd = sheet.getPhysicalNumberOfRows(); for(int j = rowStart ; j < rowEnd ; j ++){ Row row = sheet.getRow(j);//获取对应的row对象 if(row == null){ continue; } Map<String,String> dataMap = new HashMap<>(); //将每一行数据转化为一个Map对象 dataMap = convertRowToData(row,cellCount,mapKey); dataList.add(dataMap); } } return dataList; } /** * 将每一行数据转化为一个Map对象 * @param row 行对象 * @param cellCount 列数 * @param mapKey 表头Map * @return */ public static Map<String,String> convertRowToData(Row row,int cellCount,List<String> mapKey){ if(mapKey == null){ logger.info("没有表头信息"); return null; } Map<String,String> resultMap = new HashMap<>(); Cell cell = null; for(int i = 0 ; i < cellCount ; i ++){ cell = row.getCell(i); if(cell == null){ resultMap.put(mapKey.get(i),""); }else { resultMap.put(mapKey.get(i),getCellVal(cell)); } } return resultMap; } /** * 获取单元格的值 * @param cel * @return */ public static String getCellVal(Cell cel) { if(cel.getCellType() == Cell.CELL_TYPE_STRING) { return cel.getRichStringCellValue().getString(); } if(cel.getCellType() == Cell.CELL_TYPE_NUMERIC) { return cel.getNumericCellValue() + ""; } if(cel.getCellType() == Cell.CELL_TYPE_BOOLEAN) { return cel.getBooleanCellValue() + ""; } if(cel.getCellType() == Cell.CELL_TYPE_FORMULA) { return cel.getCellFormula() + ""; } return cel.toString(); } public static void main(String[] args) { //读取文件夹,批量解析Excel文件 System.out.println("--------------------读取文件夹,批量解析Excel文件-----------------------"); List<Object> returnList = readFolder("C:\\Users\\Administrator\\Desktop\\ExcelTest"); for(int i = 0 ; i < returnList.size() ; i ++){ List<Map<String,String>> maps = (List<Map<String,String>>)returnList.get(i); for(int j = 0 ; j < maps.size() ; j ++){ System.out.println(maps.get(j).toString()); } System.out.println("--------------------手打List切割线-----------------------"); } //读取单个文件 System.out.println("--------------------读取并解析单个文件-----------------------"); List<Map<String,String>> maps = readExcel("C:\\Users\\Administrator\\Desktop\\ExcelTest\\学生表.xlsx"); for(int j = 0 ; j < maps.size() ; j ++){ System.out.println(maps.get(j).toString()); } }
posted @ 2021-09-20 23:19  Zwyooo  阅读(481)  评论(0编辑  收藏  举报