在工作中需要将mongo中的数据导出到excel中,所以根据需要学习了poi。以下为学习内容的总结:

1.POI是什么?

  • poi是Apache团队开发的专门面对用java处理Excel文档的工具。
  • 官网地址:https://poi.apache.org/
  • 在操作exccel有HSSFWorkbook和XSSFWorkbook两种方式。两种方式的区别在于根据excel的版本不同,一个简单的方式就是后缀为.xls为HSSFWorkbook;后缀为.xlsx为XSSFWorkbook

2.输出Excel操作流程

  • 此部分通过代码解释使用POI将集合导出Excel的流程,在下一节中详细解释。
   /**
     * 将集合转化为Excel表格
     */
    public void getExcel(List<List<String>> list) throws IOException {
        //1.标题
        String[] title = {"招聘名称", "投递邮箱", "信息来源", "信息城市", "来源网站"};
        //2.文件名
        String fileName = new String("企业邮箱信息.xls".getBytes(), "utf-8");
        //3.sheet名
        String sheetName = new String("梧桐果、海投网、我司企业邮箱信息".getBytes(), "utf-8");

        // 1.创建一个HSSFWorkbook,对应一个Excel文件
        HSSFWorkbook hssfWorkbook = new HSSFWorkbook();
        // 2.在workbook中添加一个sheet,对应Excel文件中的sheet
        HSSFSheet sheet = hssfWorkbook.createSheet(sheetName);
        // 3.在sheet中添加表头第0行,也就是标题行
        HSSFRow row = sheet.createRow(0);
        // 4.创建单元格,并设置单元格格式
        HSSFCellStyle cellStyle = hssfWorkbook.createCellStyle();
        cellStyle.setAlignment(HSSFCellStyle.ALIGN_CENTER);//样式为中心水平对齐
        
        //5.创建列单元格
        for (int i = 0; i < title.length; i++) {
            HSSFCell cell = row.createCell(i);
            cell.setCellValue(title[i]);
            cell.setCellStyle(cellStyle);
        }//表头

        for (int y = 0; y < list.size(); y++) {
            HSSFRow row1 = sheet.createRow(y + 1);//创建行
            List<String> strings = list.get(y);
            for (int x = 0; x < title.length; x++) {
                HSSFCell cell = row1.createCell(x);
                cell.setCellValue(strings.get(x));
                cell.setCellStyle(cellStyle);//创建列
            }
        }

        File file = new File("C:\\Users\\bxk\\Desktop\\" + fileName);
        OutputStream outputStream = new FileOutputStream(file);
        hssfWorkbook.write(outputStream);
        outputStream.flush();
        outputStream.close();
    }

 3.输出Excel操作步骤详解

3.1创建出所需的文件信息

        //1.标题
        String[] title = {"招聘名称", "投递邮箱", "信息来源", "信息城市", "来源网站"};
        //2.文件名
        String fileName = new String("企业邮箱信息.xls".getBytes(), "utf-8");
        //3.sheet名
        String sheetName = new String("我是一个sheet名称".getBytes(), "utf-8");

3.2 创建WorkBook

 HSSFWorkbook hssfWorkbook = new HSSFWorkbook(); //对应一个Excel文件

  demo:如下文就可以生成一个空白的、名为workbook的xlsk文档。注意当文件名为中文的时候可能会出现乱码。使用 new String("中文","utf-8") ,将解决乱码问题。

HSSFWorkbook wb = new XSSFWorkbook(); try (OutputStream fileOut = new FileOutputStream("workbook.xlsx")) { wb.write(fileOut); }

3.3创建Sheet

HSSFSheet sheet = hssfWorkbook.createSheet(sheetName);//对应Excel文件中的sheet   其中sheetName不能为 "" ,不能为 Null

 值得注意的是,创建的过程中不会覆盖。每一个sheet都是独立的,就算此sheet并没有使用,也不会消失,而是叠加。

String safeName = WorkbookUtil.createSafeSheetName("");//这样创建的sheetName ""会转化为empty,null会转化为“null

这个sheet我当时也找了好一会,可能是实在是不熟悉Excel。sheet就表示excel中的某一张表,当然既然是表,就会有表名。所以sheetName的作用就是显示表名。上截图解释具体位置。

 3.4创建表头

HSSFRow row = sheet.createRow(0);// 在sheet中添加表头第0行,也就是标题行

 3.5创建单元格样式

HSSFCellStyle cellStyle = hssfWorkbook.createCellStyle();
cellStyle.setAlignment(HorizontalAlignment.CENTER);//样式为中心水平对齐 还有其他样式都在 HorizontalAlignment 中,可以自行查找。

 

 3.6创建列单元格

for (int i = 0; i < title.length; i++) {
            HSSFCell cell = row.createCell(i);
            cell.setCellValue(title[i]);
            cell.setCellStyle(cellStyle);
        }//表头

 

 在poi中对于excel的操作,只有行操作:定位到某一行,进行具体操作。所以就需要得到行元素HSSFRow ,在根据 HSSFCell  定位到某行的第某个单元格。

3.7创建数据

for (int y = 0; y < list.size(); y++) {
            List<String> strings = list.get(y);
            if (strings.get(0).toString().indexOf("海投") != -1 || strings.get(0).toString().indexOf("梧桐果") != -1) {
                continue;
            }
            HSSFRow row1 = sheet.createRow(y + 1);//创建行
            for (int x = 0; x < title.length; x++) {
                HSSFCell cell = row1.createCell(x);
                cell.setCellValue(strings.get(x));
                cell.setCellStyle(cellStyle);//创建列
            }
        }

3.8打印输出

  File file = new File("C:\\Users\\bxk\\Desktop\\" + fileName);
  OutputStream outputStream = new FileOutputStream(file);
  hssfWorkbook.write(outputStream);
  outputStream.flush();
  outputStream.close();

 

此处有个小提示,在idea中输出输入流或者HSSFWorkbook 等创建后,没有close的都会标红,看着实在是难受。可以try后在finally中进行close,可以解决标红。

4读取excel文件

为什么又学习了读取excel呢,就是因为我感觉爬虫的数据不够完美,打算重新爬一边,就把数据库删了....。然后那个数据一时半会也爬不下来。

(爬不下来的原因:1.爬的速度太快,ip被封,就算后来设置了得到一个数据暂停一秒也不可以。。。2.在西刺网得到一些服务器的ip和端口号,借助这些服务器去帮我爬取数据。可是这些服务器不稳定 ,有时会出现连接超时等错误,就需要手动重启项目。很麻烦。有一个想法:就是当运行出现超时错误时,重启项目。刚好设计模式中的观察者模式可以解决这个问题)

所以我就换了一个方法。。。重新读取导出的excel数据,将数据重新切割进行保存。

这个事情告诉我,删数据库之前,一定要做好备份。。。

    /**
     * 读取我司数据库 中的数据 C:\Users\bxk\Desktop\企业邮箱信息(我司数据里).xls
     */
    public List<List<String>> getExcelDateToAddress() {
        ArrayList<List<String>> lists = new ArrayList<>();
        Workbook wb = null;
        InputStream inp = null;
        try {
            inp = new FileInputStream("C:\\Users\\bxk\\Desktop\\数据.xls");
            wb = new HSSFWorkbook(inp);  //读取excel文件
            Sheet sheetAt = wb.getSheetAt(0);  //得到第一个sheet文件,
            Iterator<Row> rowIterator = sheetAt.rowIterator();  //得到行数的迭代器
            while (rowIterator.hasNext()) {
                ArrayList<String> strings = new ArrayList<>();
                Row next = rowIterator.next();
                Iterator<Cell> cellIterator = next.cellIterator();
                while (cellIterator.hasNext()) {  //得到单元格的迭代器
                    Cell next1 = cellIterator.next();
                    String stringCellValue = next1.getStringCellValue();
                    strings.add(stringCellValue);
                }
                strings.set(3, getCity(strings.get(3)));
                lists.add(strings);
            }
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                wb.close();
                inp.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        return lists;
    }

 

这个很简单,就不详细解释了。当poi读取到文件后,就会分析出sheet、行数等消息。但是我找了好半天也没有得到行数的接口。想要读取每行的信息,只能通过迭代器。

 

 

打开官网(上面有链接)——API介绍(Component)——快速指南(Quick Guide) 也能看到详细的例子和解释哦。