摘要: 要处理的目标文档中包含大量表格及各级标题,在解析表格内容前要求先将文档结构提取出来,也就是要将各级标题及标题编号读出来找到了以下三种方法。一.逐段扫描判断 1 /** 2 * 预处理Word文档 3 * @param 存储标题的容器 4 * @return 5 */ 6 public ArrayList<Heading> pretreatWord(ArrayList<Heading>headings){ 7 word=new ActiveXComponent("Word.Application"); 8 ... 阅读全文
posted @ 2013-03-21 20:57 艾布拉布斯 阅读(5363) 评论(0) 推荐(0) 编辑