摘要: 最近在写龙龙第二版网络风行者。网络风行者引入了规则体系,简介如下: 规则主要分成两部分,一是数据匹配规则,二是数据提取规则。本文详述数据匹配规则,数据提取规则只简单提及。 我认为好的规则应该具备以下两点: (1)实用,能适用于大部分应用场合 (2)易用,容易编写与调试 我看了几个国内现有的网络信息提取软件,主要是通过制定正则表达式进行提取,适用的场景有限,主要适用于1对1的数据提取场景,既从1个... 阅读全文
posted @ 2006-03-07 13:04 xiaotie 阅读(2779) 评论(5) 推荐(0) 编辑