使用POI进行写操作

一、POI简介(Apache POI)

1、什么是POI

Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能。

  • HSSF - 提供读写Microsoft Excel格式档案的功能。(.xls)
  • XSSF - 提供读写Microsoft Excel OOXML格式档案的功能。(.xlsx)
  • HWPF - 提供读写Microsoft Word格式档案的功能。
  • HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
  • HDGF - 提供读写Microsoft Visio格式档案的功能。

2、官网

http://poi.apache.org/

官网可以找到文档和每个版本的下载地址

二、创建案例项目

1、创建一个普通的maven项目

项目名:excel-poi

2、pom中引入xml相关依赖

<dependencies>

<!--xls-->

<dependency>

<groupId>org.apache.poi</groupId>

<artifactId>poi</artifactId>

<version>3.9</version>

</dependency>

<!--xlsx-->

<dependency>

<groupId>org.apache.poi</groupId>

<artifactId>poi-ooxml</artifactId>

<version>3.9</version>

</dependency>

<!--日期格式化工具-->

<dependency>

<groupId>joda-time</groupId>

<artifactId>joda-time</artifactId>

<version>2.10.1</version>

</dependency>

<!--test-->

<dependency>

<groupId>junit</groupId>

<artifactId>junit</artifactId>

<version>4.12</version>

</dependency>

</dependencies>

三、xls写-03和07的区别

1、03版本

package com.atguigu.excelpoi;

public class ExcelWriteTest {

@Test

public void testWrite03() throws IOException {

// 创建新的Excel 工作簿

Workbook workbook = new HSSFWorkbook();

// 在Excel工作簿中建一工作表,其名为缺省值 Sheet0

//Sheet sheet = workbook.createSheet();

// 如要新建一名为"会员登录统计"的工作表,其语句为:

Sheet sheet = workbook.createSheet("会员登录统计");

// 创建行(row 1)

Row row1 = sheet.createRow(0);

// 创建单元格(col 1-1)

Cell cell11 = row1.createCell(0);

cell11.setCellValue("今日人数");

// 创建单元格(col 1-2)

Cell cell12 = row1.createCell(1);

cell12.setCellValue(666);

// 创建行(row 2)

Row row2 = sheet.createRow(1);

// 创建单元格(col 2-1)

Cell cell21 = row2.createCell(0);

cell21.setCellValue("统计时间");

//创建单元格(第三列)

Cell cell22 = row2.createCell(1);

String dateTime = new DateTime().toString("yyyy-MM-dd HH:mm:ss");

cell22.setCellValue(dateTime);

// 新建一输出文件流(注意:要先创建文件夹)

FileOutputStream out = new FileOutputStream("d:/excel-poi/test-write03.xls");

// 把相应的Excel 工作簿存盘

workbook.write(out);

// 操作结束,关闭文件

out.close();

System.out.println("文件生成成功");

}

}

2 、07版本

@Test

public void testWrite07() throws IOException {

// 创建新的Excel 工作簿

Workbook workbook = new XSSFWorkbook();

......//参考03版本代码

// 新建一输出文件流(注意:要先创建文件夹)

FileOutputStream out = new FileOutputStream("d:/excel-poi/test-write07.xlsx");

......//参考03版本代码

}

注意:如果针对不同版本的Excel使用了不适合的类库,则会报告异常

org.apache.poi.POIXMLException: org.apache.poi.openxml4j.exceptions.InvalidFormatException: Package should contain a content type part [M1.13]

四、大文件写-HSSF、XSSF和SXSSF

1、使用HSSF

缺点:最多只能处理65536行,否则会抛出异常

java.lang.IllegalArgumentException: Invalid row number (65536) outside allowable range (0..65535)

优点:过程中写入缓存,不操作磁盘,最后一次性写入磁盘,速度快

@Test

public void testWrite03BigData() throws IOException {

//记录开始时间

long begin = System.currentTimeMillis();

//创建一个SXSSFWorkbook

//-1:关闭 auto-flushing,将所有数据存在内存中

Workbook workbook = new HSSFWorkbook();

//创建一个sheet

Sheet sheet = workbook.createSheet();

//xls文件最大支持65536行

for (int rowNum = 0; rowNum < 65536; rowNum++) {

//创建一个行

Row row = sheet.createRow(rowNum);

for (int cellNum = 0; cellNum < 10; cellNum++) {//创建单元格

Cell cell = row.createCell(cellNum);

cell.setCellValue(cellNum);

}

}

System.out.println("done");

FileOutputStream out = new FileOutputStream("d:/excel-poi/test-write03-bigdata.xls");

workbook.write(out);

// 操作结束,关闭文件

out.close();

//记录结束时间

long end = System.currentTimeMillis();

System.out.println((double)(end - begin)/1000);

}

2、使用XSSF

缺点:写数据时速度非常慢,非常耗内存,也会发生内存溢出,如100万条

优点:可以写较大的数据量,如20万条

@Test

public void testWrite07BigData() throws IOException {

//记录开始时间

long begin = System.currentTimeMillis();

//创建一个XSSFWorkbook

Workbook workbook = new XSSFWorkbook();

......

 

FileOutputStream out = new FileOutputStream("d:/excel-poi/test-write07-bigdata.xlsx");

 

......

}

3、使用SXSSF

优点:可以写非常大的数据量,如100万条甚至更多条,写数据速度快,占用更少的内存

注意:

过程中会产生临时文件,需要清理临时文件(C:\Users\helen\AppData\Local\Temp)

默认由100条记录被保存在内存中,如果查过这数量,则最前面的数据被写入临时文件

如果想自定义内存中数据的数量,可以使用new SXSSFWorkbook(数量)

@Test

public void testWrite07BigDataFast() throws IOException {

//记录开始时间

long begin = System.currentTimeMillis();

//创建一个SXSSFWorkbook

Workbook workbook = new SXSSFWorkbook();

......

FileOutputStream out = new FileOutputStream("d:/excel-poi/test-write07-bigdata-fast.xlsx");

workbook.write(out);

// 操作结束,关闭文件

out.close();

//清除临时文件

((SXSSFWorkbook)workbook).dispose();

//记录结束时间

long end = System.currentTimeMillis();

System.out.println((double)(end - begin)/1000);

}

SXSSFWorkbook-来至官方的解释:实现“BigGridDemo”策略的流式XSSFWorkbook版本。这允许写入非常大的文件而不会耗尽内存,因为任何时候只有可配置的行部分被保存在内存中。

请注意,仍然可能会消耗大量内存,这些内存基于您正在使用的功能,例如合并区域,注释......仍然只存储在内存中,因此如果广泛使用,可能需要大量内存。

posted @ 2022-04-25 11:19  Linux运维阿铭  阅读(110)  评论(0编辑  收藏  举报