poi实现百万级数据导出
注意使用 SXSSFWorkbook 此类在构造表格和处理行高的时候效率极高,刚开始时我使用的 XSSFWorkbook 就出现构造表格效率极低,一万行基本需要3秒左右,那当导出百万级数据就慢的要死啦,而且他会让内存溢出
POI3.8的SXSSF包是XSSF的一个扩展版本,支持流处理,在生成大数据量的电子表格且堆空间有限时使用。SXSSF通过限制内存中可访问的记录行数来实现其低内存利用,当达到限定值时,新一行数据的加入会引起老一行的数据刷新到硬盘。
比如内存中限制行数为100,当行号到达101时,行号为0的记录刷新到硬盘并从内存中删除,当行号到达102时,行号为1的记录刷新到硬盘,并从内存中删除,以此类推。
rowAccessWindowSize代表指定的内存中缓存记录数,默认为100,此值可以通过
new SXSSFWorkbook(int rowAccessWindowSize)或SXSSFSheet.setRandomAccessWindowSize(intwindowSize)来设置。
SXSSF在把内存数据刷新到硬盘时,是把每个SHEET生成一个临时文件,这个临时文件可能会很大,有可以会达到G级别,如果文件的过大对你来说是一个问题,你可以使用下面的方法让SXSSF来进行压缩,当然性能也会有一定的影响。
SXSSFWorkbook wb = new SXSSFWorkbook(); wb.setCompressTempFiles(true);
临时文件:
SXSSF在导出的过程中会生成两种临时文件,一种是为每个sheet页生成一个 xml 临时文件,一种是最终导出时生成的完整.xlsx 文件
临时文件所在位置:
windows: C盘下的 AppData\Local\Temp\poifiles 例如我的:C:\Users\011336\AppData\Local\Temp\poifiles
Linux:在Tomcat目录下的 temp/poifiles
临时文件的删除:
workbook.write(fileOut); write()方法中包含删除 .xlsx 文件的方法,在它的finally代码块里,具体可以去查看源码
workbook.dispose(); dispose()方法就是用来删除那些 xml 格式的临时文件的
需要注意的细节:
每创建完一个sheet页就会生成一个xml文件 但是所有的 xml 文件都是空的,只有调用workbook.write(fileOut); 方法时,才会往xml中写数据,也就是说之前构造的几百万数据都在内存中,这是很危险的行为,当达到一定量时可能就会有内存溢出的风险,所以要记得在每个sheet页构造完成之后都手动把数据刷到磁盘当中((SXSSFSheet)sheet).flushRows();其实write()方法中也是for循环调用的flushRows()方法。
最关键的点:
记得点赞哦...
1. CommentController
/** * excel导出功能 * @param commentSearch * @param response * @param request * @return * @throws Exception */ @RequestMapping("/exportCommentInfo") @ResponseBody @NoRepeatRequest public BaseDTO exportCommentInfo(CommentSearch commentSearch, HttpServletResponse response, HttpServletRequest request) throws Exception{ LOGGER.info("CommentController.exportCommentInfo start"); long startTime = System.currentTimeMillis(); LOGGER.info("开始下载........................................."); List<ErrorInfo> errors = null; int result = 0; String fileName = FileNameUtils.getExportCommontExcelFileName(); OutputStream fileOut = null; SXSSFWorkbook workbook = null;try { LOGGER.debug("classpath: " + fileName); workbook = new SXSSFWorkbook(10000);//内存中实时存在10000个对象,超过的实时写入磁盘,保证内存消耗不会过大 commentService.exportCommentInfo(request,workbook, commentSearch); // 定义excel文件名 response.setCharacterEncoding("UTF-8"); response.setHeader("Content-Disposition", "attachment; filename=\"" + URLEncoder.encode(fileName, "UTF-8") + "\"");
// 定义输出流
fileOut = response.getOutputStream();
// 调用导出方法生成最终的 poi-sxssf-template.xlsx 临时文件,并且此方法包含删除此临时文件的方法
workbook.write(fileOut);
// 此方法能够删除导出过程中生成的xml临时文件
workbook.dispose();
} catch (Exception e) { LOGGER.error("InterfaceInfoController.exportInterfaceInfo Exception: ", e); ErrorInfo errorInfo = new ErrorInfo("system.error", "系统异常!"); errors = Arrays.asList(errorInfo); }finally { workbook.close(); } LOGGER.info("下载完成....|||||.......用时:" + (System.currentTimeMillis() - startTime)); return tranferBaseDTO(errors, result); }
2.导出实现类 exportCommentInfo
/** * excel 导出 * @param: [request, workbook, commentSearch] * @return: void * @auther: 011336 * @date: 2018/12/7 15:03 */ @Override public void exportCommentInfo(HttpServletRequest request, SXSSFWorkbook workbook, CommentSearch commentSearch) { //excel样式 CellStyle centerStyle = workbook.createCellStyle(); CellStyle cellStyleCenter = workbook.createCellStyle(); CellStyle cellStyleLeft = workbook.createCellStyle(); cellStyleCenter.setAlignment(HSSFCellStyle.ALIGN_CENTER); //水平布局:居中 cellStyleCenter.setVerticalAlignment(CellStyle.VERTICAL_CENTER);//垂直居中 cellStyleCenter.setWrapText(true); cellStyleLeft.setAlignment(HSSFCellStyle.ALIGN_LEFT); //水平布局:居左 cellStyleLeft.setVerticalAlignment(CellStyle.VERTICAL_CENTER);//垂直居中 cellStyleLeft.setWrapText(true); Font font =workbook.createFont(); font.setColor(Font.COLOR_NORMAL); //字体颜色 font.setFontName("黑体"); //字体 font.setBoldweight(HSSFFont.BOLDWEIGHT_BOLD); //宽度 // 设置标题单元格类型 centerStyle.setFont(font); centerStyle.setAlignment(HSSFCellStyle.ALIGN_CENTER); //水平布局:居中 centerStyle.setWrapText(true); centerStyle.setAlignment(XSSFCellStyle.ALIGN_CENTER); centerStyle.setFillPattern(HSSFCellStyle.SOLID_FOREGROUND);//设置前景填充样式 centerStyle.setFillForegroundColor(HSSFColor.GREY_50_PERCENT.index);//前景填充色 CreationHelper createHelper = workbook.getCreationHelper(); // 设置标题边框 centerStyle.setBorderBottom(HSSFCellStyle.BORDER_THIN); centerStyle.setBorderLeft(HSSFCellStyle.BORDER_THIN); centerStyle.setBorderRight(HSSFCellStyle.BORDER_THIN); centerStyle.setBorderTop(HSSFCellStyle.BORDER_THIN); //分批导出 int totalCount = countCommentNum(commentSearch); //如果导出数据量大于 设定的最大数据量 则最多不能超过设定的数量 if(pageNumExport != null && totalCount > pageNumExport*limitExport){ totalCount = pageNumExport*limitExport; } int number = (totalCount % limitExport) == 0 ? totalCount / limitExport : totalCount / limitExport + 1;
List<CommentVo> commentVOs = new ArrayList<>();
for (int i = 0; i < number; i++) {long startTime = System.currentTimeMillis(); LOGGER.info("【第"+i+"】次开始查询数据库........................................."); commentVOs = getCommentVoExport(commentSearch, i*limitExport, limitExport); LOGGER.info("【第"+i+"】次数据库查询完成....|||||.......用时:" + (System.currentTimeMillis() - startTime)); int page = i+1; Sheet sheet = workbook.createSheet("评论清单"+( page<10 ? "0"+page : page ) );
batchExport(request,sheet, commentSearch, commentVOs, centerStyle, cellStyleCenter, cellStyleLeft);
try {
((SXSSFSheet)sheet).flushRows();//每创建完成一个sheet页就把数据刷新到磁盘
} catch (IOException e) {
LOGGER.error("CommentServiceImpl.exportCommentInfo flushRows() exception ,that is not important"+e);
e.printStackTrace();
}
commentVOs.clear(); } }
-----提示:如果这里不手动刷的话,当所有sheet页都刷到内存中后,workbook.write()方法会采用for循环把所有的数据都刷到磁盘中,也就是说,如果这里不手动刷,那么所有的对象就都在内存中。
实测表明 即使它已经创建的xml临时文件,此时所有的xml临时文件也是空的,都只能通过最后的workbook.write()方法统一刷新到磁盘。那么就可能会有内存溢出的风险
3. batchExport(request,sheet, commentSearch, commentVOs, centerStyle, cellStyleCenter, cellStyleLeft); 的实现
/** * 构造excel,赋值,样式 * @param: [request, sheet, commentSearch, commentVOs, centerStyle, cellStyleCenter, cellStyleLeft] * @return: void * @auther: 011336 * @date: 2018/12/7 15:20 */ public void batchExport(HttpServletRequest request,Sheet sheet , CommentSearch commentSearch,List<CommentVo> commentVOs, CellStyle centerStyle,CellStyle cellStyleCenter,CellStyle cellStyleLeft){ if (CollectionUtils.isEmpty(commentVOs)) { LOGGER.debug("exportCommentInfo finish: " + commentVOs); } Row newRowOfInparamTitle = sheet.createRow(0); String[] headerOfInParam = { "序号", "评价日期", "来源", "星级", "评论内容", "类型一级", "类型二级", "类型三级", "情感识别","建议类","订单号", "航班号", "航班日期","订单联系人","联系电话","备注"}; for (int j = 0; j < headerOfInParam.length; j++) { newRowOfInparamTitle.createCell(j); } for (int j = 0; j < headerOfInParam.length; j++) { sheet.getRow(0).getCell(j).setCellValue(new XSSFRichTextString(headerOfInParam[j])); sheet.getRow(0).getCell(j).setCellStyle(centerStyle); } long startTime = System.currentTimeMillis(); LOGGER.info("构造表格开始........................................."); for (int i = 0; i < commentVOs.size(); i++) { CommentVo commentVo = commentVOs.get(i); int index = i + 1; Row createRow = sheet.createRow(i + 1); for (int j = 0; j < headerOfInParam.length; j++) { createRow.createCell(j); } sheet.getRow(i + 1).getCell(0).setCellValue(index + ""); sheet.getRow(i + 1).getCell(0).setCellStyle(cellStyleCenter); sheet.getRow(i + 1).getCell(1).setCellValue(dealTrim(dateToStr2(commentVo.getCmtTime()))); sheet.getRow(i + 1).getCell(1).setCellStyle(cellStyleCenter); sheet.getRow(i + 1).getCell(2).setCellValue(dealTrim(commentVo.getTerminalId())); sheet.getRow(i + 1).getCell(2).setCellStyle(cellStyleCenter); sheet.getRow(i + 1).getCell(3).setCellValue(dealTrim(commentVo.getCmtLevel())); sheet.getRow(i + 1).getCell(3).setCellStyle(cellStyleCenter); sheet.getRow(i + 1).getCell(4).setCellValue(dealTrim(commentVo.getCmtText())); sheet.getRow(i + 1).getCell(4).setCellStyle(cellStyleLeft); sheet.getRow(i + 1).getCell(5).setCellValue(dealTrim(dealTrim(commentVo.getClassfyFirst()))); sheet.getRow(i + 1).getCell(5).setCellStyle(cellStyleLeft); sheet.getRow(i + 1).getCell(6).setCellValue(dealTrim(commentVo.getClassfySecond())); sheet.getRow(i + 1).getCell(6).setCellStyle(cellStyleLeft); sheet.getRow(i + 1).getCell(7).setCellValue(dealTrim(commentVo.getClassfyThird())); sheet.getRow(i + 1).getCell(7).setCellStyle(cellStyleLeft); String emotion = commentVo.getEmotion(); if("0".equals(emotion)){ emotion="差评"; }else if("1".equals(emotion)){ emotion="好评"; } sheet.getRow(i + 1).getCell(8).setCellValue(dealTrim(emotion)); sheet.getRow(i + 1).getCell(8).setCellStyle(cellStyleCenter); String isSuggestion = commentVo.getIsSuggestion(); if("0".equals(isSuggestion)){ isSuggestion="否"; }else if("1".equals(isSuggestion)){ isSuggestion="是"; } sheet.getRow(i + 1).getCell(9).setCellValue(dealTrim(isSuggestion)); sheet.getRow(i + 1).getCell(9).setCellStyle(cellStyleCenter); sheet.getRow(i + 1).getCell(10).setCellValue(dealTrim(commentVo.getOrderNo())); sheet.getRow(i + 1).getCell(10).setCellStyle(cellStyleCenter); sheet.getRow(i + 1).getCell(11).setCellValue(dealTrim(commentVo.getFlightNo())); sheet.getRow(i + 1).getCell(11).setCellStyle(cellStyleCenter); sheet.getRow(i + 1).getCell(12).setCellValue(dateToStr(commentVo.getFlightDate())); sheet.getRow(i + 1).getCell(12).setCellStyle(cellStyleCenter); sheet.getRow(i + 1).getCell(13).setCellValue(dealTrim(commentVo.getcName())); sheet.getRow(i + 1).getCell(13).setCellStyle(cellStyleLeft); sheet.getRow(i + 1).getCell(14).setCellValue(dealTrim(commentVo.getcTel())); sheet.getRow(i + 1).getCell(14).setCellStyle(cellStyleLeft); sheet.getRow(i + 1).getCell(15).setCellValue(dealTrim(commentVo.getRemark())); sheet.getRow(i + 1).getCell(15).setCellStyle(cellStyleLeft); if(i%1000 == 0){ request.getSession().setAttribute("currentNum",i+1); } } LOGGER.info("构造表格结束....|||||.......用时:" + (System.currentTimeMillis() - startTime)); long startTime2 = System.currentTimeMillis(); LOGGER.info("处理行高开始........................................."); dealColumWidth( headerOfInParam, sheet,commentVOs, request); LOGGER.info("处理行高结束....|||||.......用时:" + (System.currentTimeMillis() - startTime2)); }
4. 处理行高代码的实现 dealColumWidth( headerOfInParam, sheet,commentVOs, request);这里主要是设置固定列宽,然后自适应行高,二期自适应行高他是不提供方法的,只能自己去计算
/** * 设置列宽 * @param: [headerOfInParam, sheet, commentVOs, request] * @return: void * @auther: 011336 * @date: 2018/12/7 15:20 */ public void dealColumWidth(String[] headerOfInParam,Sheet sheet,List<CommentVo> commentVOs,HttpServletRequest request){ //单独处理 评论内容 和 评论备注 以及 分类 的宽度 和高度 sheet.setColumnWidth(1, 5500);//11个汉字 评价日期 sheet.setColumnWidth(2, 1500);//3个汉字 来源 sheet.setColumnWidth(3, 1500);//3个汉字 星级 sheet.setColumnWidth(4, 12000);//24个汉字 评论 sheet.setColumnWidth(5, 3000);//6个汉字 分类1 sheet.setColumnWidth(6, 3000);//6个汉字 分类2 sheet.setColumnWidth(7, 4000);//8个汉字 分类3 sheet.setColumnWidth(8, 2500);//5个汉字 情感识别 sheet.setColumnWidth(9, 2000);//4个汉字 建议类 sheet.setColumnWidth(10, 2500);//5个汉字 订单号 sheet.setColumnWidth(11, 2500);//5个汉字 航班号 sheet.setColumnWidth(12, 3500);//7个汉字 航班日期 sheet.setColumnWidth(13, 4000);//8个汉字 订单联系人 sheet.setColumnWidth(14, 4000);//8个汉字 联系电话 sheet.setColumnWidth(15, 10000);//20个汉字 备注 double rn = 20.00 , cn = 24.00 ,c1 = 6.00 ,c2 = 6.00 ,c3 = 8.00 , nn = 8.00;//ca应该为20可是导出结果却换行不对所以改成16保险一点 //计算 设置自定义行高 for (int i = 0; i < commentVOs.size(); i++) { //计算行高 CommentVo commentVo = commentVOs.get(i); int charNumC1 = (int)Math.ceil( dealTrim(commentVo.getClassfyFirst()).length() / c1 );//分类1 int charNumC2 = (int)Math.ceil( dealTrim(commentVo.getClassfySecond()).length() / c2 );//分类2 int charNumC3 = (int)Math.ceil( dealTrim(commentVo.getClassfyThird()).length() / c3 );//分类2 int charNumRemark = (int)Math.ceil( dealTrim(commentVo.getRemark()).length() / rn );//备注 int charNumComent = (int)Math.ceil( dealTrim(commentVo.getCmtText()).length() / cn);//评论 int charNumName = (int)Math.ceil( dealTrim(commentVo.getcName()).length() / nn);//订单联系人 List<Integer> input = new ArrayList<Integer>(); //input.add(charNum+num);//charNum 是分类的条数,每条一行。num是分类字数大于20的情况就多分配一行 input.add(charNumC1); input.add(charNumC2); input.add(charNumC3); input.add(charNumRemark); input.add(charNumComent); input.add(charNumName); int rowNum = Collections.max(input); Row row = sheet.getRow(i+1); row.setHeight((short)(sheet.getDefaultRowHeight()*rowNum)); } request.getSession().setAttribute("currentNum",commentVOs.size()); }
代码中的request可忽略,那是我做的进度条,