01 2009 档案

摘要:需要做一个垂直搜索引擎,比较了nekohtml和htmlparser 的功能,尽管nekohtml在容错性、性能等方面的口碑好像比htmlparser好(htmlunit也用的是nekohtml),但感觉 nekohtml的测试用例和文档都比htmlparser都少,而且htmlparser基本上能够满足垂直搜索引擎页面处理分析的需求,因此先研究一 下htmlparser的使用,有空再研究nekohtml和mozilla html parser的使用。 html的功能还是官方说得最为清楚,HTML Parser is a Java library used to parse HTML in e 阅读全文
posted @ 2009-01-21 14:36 ljlxyf 阅读(216) 评论(0) 推荐(0) 编辑
摘要:发布日期:2006-4-11 14:46:26 作者: 出处:http://www.manbu.netPDF文件是目前比较流行的电子文档格式,在办公自动化(OA)等软件的开发中,经常要用到该格式,但介绍如何制作PDF格式文件的资料非常少,在网上搜来搜去,都转贴的是同一段“暴力”破解的方法,代码片断如下: StreamWriter pPDF=new StreamWriter(filePath); ArrayList xRefs=new ArrayList(); float yPos =0f; long streamStart=0; long streamEnd=0; long streamLen 阅读全文
posted @ 2009-01-12 15:37 ljlxyf 阅读(210) 评论(0) 推荐(0) 编辑