Java读取批量Excel文件，并转化为List<Map<String,String>>

2021-03-15 23:14 GarfieldEr007 阅读(1689) 评论(0) 收藏举报

1.首先基础知识：
一：简介

开发中经常会设计到excel的处理，如导出Excel，导入Excel到数据库中，操作Excel目前有两个框架，一个是apache 的poi，另一个是 Java Excel

Apache POI 简介是用Java编写的免费开源的跨平台的 Java API，Apache POI提供API给Java程式对Microsoft Office（Excel、WORD、PowerPoint、Visio等）格式档案读和写的功能。POI为“Poor Obfuscation Implementation”的首字母缩写，意为“可怜的模糊实现”。

官方主页： http://poi.apache.org/index.html

API文档： http://poi.apache.org/apidocs/index.html

Java Excel是一开放源码项目，通过它Java开发人员可以读取Excel文件的内容、创建新的Excel文件、更新已经存在的Excel文件。jxl 由于其小巧易用的特点, 逐渐已经取代了 POI-excel的地位, 成为了越来越多的java开发人员生成excel文件的首选。

由于apache poi 在项目中用的比较多，本篇博客只讲解apache poi，不讲jxl

二：Apache POI常用的类

HSSF －提供读写Microsoft Excel XLS格式档案的功能。

XSSF －提供读写Microsoft Excel OOXML XLSX格式档案的功能。

HWPF －提供读写Microsoft Word DOC97格式档案的功能。

XWPF －提供读写Microsoft Word DOC2003格式档案的功能。

HSLF －提供读写Microsoft PowerPoint格式档案的功能。

HDGF －提供读Microsoft Visio格式档案的功能。

HPBF －提供读Microsoft Publisher格式档案的功能。

HSMF －提供读Microsoft Outlook格式档案的功能。

在开发中我们经常使用HSSF用来操作Excel处理表格数据，对于其它的不经常使用。

HSSF 是Horrible SpreadSheet Format的缩写，通过HSSF，你可以用纯Java代码来读取、写入、修改Excel文件。HSSF 为读取操作提供了两类API：usermodel和eventusermodel，即“用户模型”和“事件-用户模型”。

常用的类和方法

HSSFWorkbook ：工作簿，代表一个excel的整个文档

HSSFWorkbook(); // 创建一个新的工作簿

HSSFWorkbook(InputStream inputStream); // 创建一个关联输入流的工作簿，可以将一个excel文件封装成工作簿

HSSFSheet createSheet(String sheetname); 创建一个新的Sheet

HSSFSheet getSheet(String sheetName); 通过名称获取Sheet

HSSFSheet getSheetAt(int index); // 通过索引获取Sheet，索引从0开始

HSSFCellStyle createCellStyle()；创建单元格样式

int getNumberOfSheets(); 获取sheet的个数

setActiveSheet(int index); 设置默认选中的工作表

write();

write(File newFile);

write(OutputStream stream);

HSSFSheet：工作表

HSSFRow createRow(int rownum); 创建新行，需要指定行号，行号从0开始

HSSFRow getRow(int index); 根据索引获取指定的行

int addMergedRegion(CellRangeAddress region); 合并单元格

CellRangeAddress(int firstRow, int lastRow, int firstCol, int lastCol); 单元格范围, 用于合并单元格，需要指定要合并的首行、最后一行、首列、最后一列。

autoSizeColumn(int column); 自动调整列的宽度来适应内容

getLastRowNum(); 获取最后的行的索引，没有行或者只有一行的时候返回0

setColumnWidth(int columnIndex, int width); 设置某一列的宽度，width=字符个数 * 256，例如20个字符的宽度就是20 * 256

HSSFRow ：行

HSSFCell createCell(int column); 创建新的单元格

HSSFCell setCell(shot index);

HSSFCell getCell(shot index);

setRowStyle(HSSFCellStyle style); 设置行样式

short getLastCellNum(); 获取最后的单元格号，如果单元格有第一个开始算，lastCellNum就是列的个数

setHeightInPoints(float height); 设置行的高度

HSSFCell：单元格

setCellValue(String value); 设置单元格的值

setCellType(); 设置单元格类型，如字符串、数字、布尔等

setCellStyle(); 设置单元格样式

String getStringCellValue(); 获取单元格中的字符串值

setCellStyle(HSSFCellStyle style); 设置单元格样式，例如字体、加粗、格式化

setCellFormula(String formula); 设置计算公式，计算的结果作为单元格的值，也提供了异常常用的函数，如求和"sum(A1,C1)"、日期函数、字符串相关函数、CountIf和SumIf函数、随机数函数等

HSSFCellStyle ：单元格样式

setFont(Font font); 为单元格设置字体样式

setAlignment(HorizontalAlignment align); // 设置水平对齐方式

setVerticalAlignment(VerticalAlignment align); // 设置垂直对齐方式

setFillPattern(FillPatternType fp);

setFillForegroundColor(short bg); 设置前景色

setFillBackgroundColor(short bg); 设置背景颜色

HSSFFont：字体，

setColor(short color); // 设置字体颜色

setBold(boolean bold); // 设置是否粗体

setItalic(boolean italic); 设置倾斜

setUnderline(byte underline); 设置下划线

HSSFName：名称

HSSFDataFormat ：日期格式化

HSSFHeader ： Sheet的头部

HSSFFooter ：Sheet的尾部

HSSFDateUtil ：日期工具

HSSFPrintSetup ：打印设置

HSSFErrorConstants：错误信息表

Excel中的工作簿、工作表、行、单元格中的关系：

一个Excel文件对应于一个workbook(HSSFWorkbook)，

一个workbook可以有多个sheet（HSSFSheet）组成，

一个sheet是由多个row（HSSFRow）组成，

一个row是由多个cell（HSSFCell）组成

2. 简单实现一个Excel工具类，可以修改引用
支持读取文件夹，批量解析Excel文件；

也支持读取单个文件，解析单个Excel文件。

import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.io.File;
import java.io.FileInputStream;
import java.util.*;

public class ExcelUtil {

private static final Logger logger = LoggerFactory.getLogger(ExcelUtil.class);

private static final String XLS = ".xls";
private static final String XLSX = ".xlsx";

/**
* 根据文件后缀获取对应Workbook对象
* @param filePath
* @param fileType
* @return
*/
public static Workbook getWorkbook(String filePath,String fileType){
Workbook workbook = null;
FileInputStream fileInputStream = null;
try{
File excelFile = new File(filePath);
if(!excelFile.exists()){
logger.info(filePath+"文件不存在");
return null;
}
fileInputStream = new FileInputStream(excelFile);
if(fileType.equalsIgnoreCase(XLS)){
workbook = new HSSFWorkbook(fileInputStream);
}else if(fileType.equalsIgnoreCase(XLSX)){
workbook = new XSSFWorkbook(fileInputStream);
}
}catch (Exception e){
logger.error("获取文件失败",e);
}finally {
try {
if (null != fileInputStream) {
fileInputStream.close();
}
} catch (Exception e) {
logger.error("关闭数据流出错！错误信息：" , e);
return null;
}
}
return workbook;
}

public static List<Object> readFolder(String filePath){
int fileNum = 0;
File file = new File(filePath);
List<Object> returnList = new ArrayList<>();
List<Map<String,String>> resultList = new ArrayList<>();
if (file.exists()) {
File[] files = file.listFiles();
for (File file2 : files) {
if (file2.isFile()) {
resultList = readExcel(file2.getAbsolutePath());
returnList.add(resultList);
fileNum++;
}
}
} else {
logger.info("文件夹不存在");
return null;
}
logger.info("共有文件："+fileNum);
return returnList;
}

/**
* 批量读取Excel文件，返回数据对象
* @param filePath
* @return
*/
public static List<Map<String,String>> readExcel(String filePath){
Workbook workbook = null;
List<Map<String,String>> resultList = new ArrayList<>();
try{
String fileType = filePath.substring(filePath.lastIndexOf("."));
workbook = getWorkbook(filePath,fileType);
if(workbook == null){
logger.info("获取workbook对象失败");
return null;
}
resultList = analysisExcel(workbook);
return resultList;
}catch (Exception e){
logger.error("读取Excel文件失败"+filePath+"错误信息",e);
return null;
}finally {
try {
if (null != workbook) {
workbook.close();
}
} catch (Exception e) {
logger.error("关闭数据流出错！错误信息：" , e);
return null;
}

}
}

/**
* 解析Excel文件，返回数据对象
* @param workbook
* @return
*/
public static List<Map<String,String>> analysisExcel(Workbook workbook){
List<Map<String,String>> dataList = new ArrayList<>();
int sheetCount = workbook.getNumberOfSheets();//或取一个Excel中sheet数量
for(int i = 0 ; i < sheetCount ; i ++){
Sheet sheet = workbook.getSheetAt(i);

if(sheet == null){
continue;
}
int firstRowCount = sheet.getFirstRowNum();//获取第一行的序号
Row firstRow = sheet.getRow(firstRowCount);
int cellCount = firstRow.getLastCellNum();//获取列数

List<String> mapKey = new ArrayList<>();

//获取表头信息，放在List中备用
if(firstRow == null){
logger.info("解析Excel失败，在第一行没有读取到任何数据！");
}else {
for (int i1 = 0; i1 < cellCount; i1++) {
mapKey.add(firstRow.getCell(i1).toString());
}
}

//解析每一行数据，构成数据对象
int rowStart = firstRowCount + 1;
int rowEnd = sheet.getPhysicalNumberOfRows();
for(int j = rowStart ; j < rowEnd ; j ++){
Row row = sheet.getRow(j);//获取对应的row对象

if(row == null){
continue;
}

Map<String,String> dataMap = new HashMap<>();
//将每一行数据转化为一个Map对象
dataMap = convertRowToData(row,cellCount,mapKey);
dataList.add(dataMap);
}
}
return dataList;
}

/**
* 将每一行数据转化为一个Map对象
* @param row 行对象
* @param cellCount 列数
* @param mapKey 表头Map
* @return
*/
public static Map<String,String> convertRowToData(Row row,int cellCount,List<String> mapKey){
if(mapKey == null){
logger.info("没有表头信息");
return null;
}
Map<String,String> resultMap = new HashMap<>();
Cell cell = null;
for(int i = 0 ; i < cellCount ; i ++){
cell = row.getCell(i);
if(cell == null){
resultMap.put(mapKey.get(i),"");
}else {
resultMap.put(mapKey.get(i),getCellVal(cell));
}
}
return resultMap;
}

/**
* 获取单元格的值
* @param cel
* @return
*/
public static String getCellVal(Cell cel) {
if(cel.getCellType() == Cell.CELL_TYPE_STRING) {
return cel.getRichStringCellValue().getString();
}
if(cel.getCellType() == Cell.CELL_TYPE_NUMERIC) {
return cel.getNumericCellValue() + "";
}
if(cel.getCellType() == Cell.CELL_TYPE_BOOLEAN) {
return cel.getBooleanCellValue() + "";
}
if(cel.getCellType() == Cell.CELL_TYPE_FORMULA) {
return cel.getCellFormula() + "";
}
return cel.toString();
}

public static void main(String[] args) {
//读取文件夹，批量解析Excel文件
System.out.println("--------------------读取文件夹，批量解析Excel文件-----------------------");
List<Object> returnList = readFolder("C:\\Users\\Administrator\\Desktop\\ExcelTest");
for(int i = 0 ; i < returnList.size() ; i ++){
List<Map<String,String>> maps = (List<Map<String,String>>)returnList.get(i);
for(int j = 0 ; j < maps.size() ; j ++){
System.out.println(maps.get(j).toString());
}
System.out.println("--------------------手打List切割线-----------------------");
}

//读取单个文件
System.out.println("--------------------读取并解析单个文件-----------------------");
List<Map<String,String>> maps = readExcel("C:\\Users\\Administrator\\Desktop\\ExcelTest\\学生表.xlsx");
for(int j = 0 ; j < maps.size() ; j ++){
System.out.println(maps.get(j).toString());
}

}
运行结果
文件夹ExcelTest内容：

学生表内容：

用户表内容：

最终运行结果：

主要参考博客网址：

https://blog.csdn.net/vbirdbest/article/details/72870714

https://www.cnblogs.com/Dreamer-1/p/10469430.html

https://blog.csdn.net/wangwenjie1997/article/details/90933223

https://blog.csdn.net/summerdirewof/article/details/83822710
————————————————
版权声明：本文为CSDN博主「小白逆流而上」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/baidu_39298625/article/details/105842725

刷新页面返回顶部

GarfieldEr007

Java读取批量Excel文件，并转化为List<Map<String,String>>

About