2013 年 3月 21 日随笔档案 - 艾布拉布斯

2013年3月21日

摘要：要处理的目标文档中包含大量表格及各级标题，在解析表格内容前要求先将文档结构提取出来，也就是要将各级标题及标题编号读出来找到了以下三种方法。一.逐段扫描判断 1 /** 2 * 预处理Word文档 3 * @param 存储标题的容器 4 * @return 5 */ 6 public ArrayList<Heading> pretreatWord(ArrayList<Heading>headings){ 7 word=new ActiveXComponent("Word.Application"); 8 ... 阅读全文

posted @ 2013-03-21 20:57 艾布拉布斯阅读(5363) 评论(0) 推荐(0) 编辑

电子笔记

Happytime08: eoe

公告