2009 年 2月 26 日随笔档案 - RobertFang

摘要：文章提出一种基于DOM的Web信息提取方法，通过归纳学习获得被提取信息的定位路径，利用XPath和XSLT在数据定位和数据转换方面的特点编写提取模式，根据网页元素与DOM节点对应关系，判断所获得信息源是否适用于已有提取模式。阅读全文

posted @ 2009-02-26 11:21 RobertFang 阅读(2964) 评论(1) 推荐(0) 编辑