Java读取Excel并解析文本(并格式化输出)

Java读取Excel并解析文本(并格式化输出)

原创 2015年05月06日 20:00:48

说明

最近在做一个比较小型的网站,需要批量导入注册用户.用户的信息写在一张excel表格里面. 
所以就需要读取excel.所以就记录下遇到的问题,以及以后查看.

相关技术

使用的POI解析Excel需要使用的jar包 
这里写图片描述
注(使用的maven.我就添加了右边的两个依赖就可以了)

分析

解析Excel首先就要解析Excel的结构.然后用面向对象的思想分析一下 
这里写图片描述 
这是一个excel文件.下面我们就来分析一下如果让你写这个poi框架,那么你会怎么设计. 
1. 首先要有一个对象表示这整个Excel文件. 
2. 可是这个excel文件中有好多页.Sheet1, Sheet2等等,所以我们还需要一个对象表示页. 
3. 在页中,有行,所以还需要一个对象表示行. 
4. 在行中,最后细分到格cell. 
5. 格cell中数据还有好多类型.有字符串,数字,时间等等.

POI中的对象与excel对象的对应

excel文件就有多种类型了.后缀有 xls 与 xlsx 
这里写图片描述 
所以对于不同类型的文件,就需要使用不同的poi中的对象了. 
1. 如果你要解析的是xls文件 
这里写图片描述
从代码不难发现,这里的处理逻辑是 
1>. 先用inputstream获取excel文件的io流 
2>. 然后创建一个内存中的excel文件HSSFWorkbook类型对象.这个对象表示了整个excel文件. 
3>. 对这个excel文件的每页做循环处理 
4>. 对每页中的每行做循环处理. 
5>. 对每行中的每个单元格做做处理,获取这个单元格的值. 
6>. 把这行的结果添加到一个List数组中. 
7>. 把每行的结果添加到最后的总结果中. 
8>. 解析完以后就获取了一个List< List < String > > 类型的对象了. 
2. 如果你要处理xlsx类型的文件则 
这里写图片描述 
和上面一样,我就不说了.

存在的问题

其实有时候我们希望得到的数据就是excel中的数据,可是最后发现结果不理想 
如果你的excel中的数据是数字,你会发现java中对应的变成了科学计数法的. 
所以在获取值的时候就要做一些特殊处理. 
这样就能保证获取的值是我想要的值. 
网上的做法是对于数值类型的数据格式化,获取自己想要的结果. 
其实也没有那么麻烦.我在做的时候突然想到了一种处理解决方案.供参考 
我们看一下poi中对于的toString()方法 
这里写图片描述 
该方法是poi的方法,从源码中我们可以发现,该处理流程是 
1. 获取单元格的类型 
2. 根据类型格式化数据并输出.这不一下子就造成了很多不是我们想要的. 
所以我们就要改造一下这个方法例如这样 
这里写图片描述 
我的做法是这样的 
1. 对于不熟悉的类型,或者为空则返回”” 控制串. 
2.如果是数字,则修改单元格类型为String,然后返回String.这样就保证数字不被格式化了. 
3. 虽然不知道这么做有什么后果,可是成功了. 
这里写图片描述

 

 

下面是单元格类型说明:

类型

 

CELL_TYPE_BLANK

空值(cell不为空)

CELL_TYPE_BOOLEAN

布尔

CELL_TYPE_ERROR

错误

CELL_TYPE_FORMULA

公式

CELL_TYPE_STRING

字符串

CELL_TYPE_NUMERIC

数值

posted @ 2017-12-21 16:38  老鸟在飞  阅读(3780)  评论(0编辑  收藏  举报