会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
卖银鳞胸甲的D61
物美价廉,5G1件
博客园
首页
新随笔
联系
订阅
管理
2006年3月7日
网络风行者(KSpider)的规则体系结构
摘要: 最近在写龙龙第二版网络风行者。网络风行者引入了规则体系,简介如下: 规则主要分成两部分,一是数据匹配规则,二是数据提取规则。本文详述数据匹配规则,数据提取规则只简单提及。 我认为好的规则应该具备以下两点: (1)实用,能适用于大部分应用场合 (2)易用,容易编写与调试 我看了几个国内现有的网络信息提取软件,主要是通过制定正则表达式进行提取,适用的场景有限,主要适用于1对1的数据提取场景,既从1个...
阅读全文
posted @ 2006-03-07 13:04 xiaotie
阅读(2779)
评论(5)
推荐(0)
编辑
公告