摘要: 文章提出一种基于DOM的Web信息提取方法,通过归纳学习获得被提取信息的定位路径,利用XPath和XSLT在数据定位和数据转换方面的特点编写提取模式,根据网页元素与DOM节点对应关系,判断所获得信息源是否适用于已有提取模式。 阅读全文
posted @ 2009-02-26 11:21 RobertFang 阅读(2964) 评论(1) 推荐(0) 编辑