1 2

HSSFWorkbook和XSSFWorkbook 与WorkbookFactory的区别

通过Poi操作Excel十分方便,将一个Excel抽象为一个Workbook,一个表单页抽象为Sheet,表单中的一行抽象为Row,一行中的一个单元格可以抽象为Cell。HSSF对应的是97-03格式(.xls),XSSF对应的是07格式的(.xlsx)。

      Workbook的获取有以下几种方式:

      1.可以通过WorkbookFactory,工厂方法

         Workbook wb=WorkbookFactory.create(new FileInputStream(file));//可以读取xls格式或xlsx格式。

      2.直接通过HSSFWorkbook的构造方法

         Workbook wb=new HSSFWorkbook();//生成一个空的Excel文件

         Workbook wb=new HSSFWorkbook(new FileInputStream(file));//只能读取xls后缀的Excel文件.

      3.直接通过XSSFWorkbook的构造方法

         Workbook wb=new XSSFWorkbook();//生成一个空的Excel文件

         Workbook wb=new XSSFWorkbook(new FileInputStream(file));//只能读取xlsx后缀的Excel文件

      Sheet可由Workbook创建

         Sheet s=wb.createSheet(sheet);//创建一个名为sheet的表单

      Row由Sheet创建

         Row r=s.createRow(row);//新创建一行,行号为row+1

      Cell有Row创建

         Cell c=r.createCell(col);//创建一个单元格,列号为col+1

      最后就可以通过c.setCellValue(value)向单元格填充内容即可

 


我们使用POI中的HSSFWorkbook来读取Excel数据。

 
public void test(File file) throws IOException {  
        InputStream inp = new FileInputStream(file);  
        HSSFWorkbook workbook = new HSSFWorkbook(inp);  
          
        // workbook...遍历操作  
    }  

上边代码,读取Excel2003(xls)的文件没问题,但是一旦读取的是Excel2007(xlsx)的文件,就会报异常:“The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF)”

查阅了资料,Excel2007版本的Excel文件需要使用XSSFWorkbook来读取,如下:

 

public void test(File file) throws IOException {  
        InputStream inp = new FileInputStream(file);  
        XSSFWorkbook workbook = new XSSFWorkbook(inp);  
          
        // workbook...遍历操作  
    }  

 

注意:XSSFWorkbook需要额外导入poi-ooxml-3.9-sources.jar和poi-ooxml-schemas-3.9.jar。

 

这样,Excel2007的导入没问题了,但是导入Excel2003又报异常。

 

所以,在导入Excel的时候,尽量能判断导入Excel的版本,调用不同的方法。

我想到过使用文件后缀名来判断类型,但是如果有人将xlsx的后缀改为xls时,如果使用xlsx的函数来读取,结果是报错;虽然后缀名对了,但是文件内容编码等都不对。

最后,推荐使用poi-ooxml中的WorkbookFactory.create(inputStream)来创建Workbook,因为HSSFWorkbook和XSSFWorkbook都实现了Workbook接口。代码如下:

Workbook wb = WorkbookFactory.create(is);  


可想而知,在WorkbookFactory.create()函数中,肯定有做过对文件类型的判断,一起来看一下源码是如何判断的:

/** 
     * Creates the appropriate HSSFWorkbook / XSSFWorkbook from 
     *  the given InputStream. 
     * Your input stream MUST either support mark/reset, or 
     *  be wrapped as a {@link PushbackInputStream}! 
     */  
    public static Workbook create(InputStream inp) throws IOException, InvalidFormatException {  
        // If clearly doesn't do mark/reset, wrap up  
        if(! inp.markSupported()) {  
            inp = new PushbackInputStream(inp, 8);  
        }  
          
        if(POIFSFileSystem.hasPOIFSHeader(inp)) {  
            return new HSSFWorkbook(inp);  
        }  
        if(POIXMLDocument.hasOOXMLHeader(inp)) {  
            return new XSSFWorkbook(OPCPackage.open(inp));  
        }  
        throw new IllegalArgumentException("Your InputStream was neither an OLE2 stream, nor an OOXML stream");  
    }  

 

可以看到,有根据文件类型来分别创建合适的Workbook对象。是根据文件的头部信息去比对进行判断的,此时,就算改了后缀名,还是一样通不过。

 

posted @ 2017-09-07 15:49  大海的泡沫  阅读(11379)  评论(0编辑  收藏  举报
1 2