用正则表达式作html2RSS服务
摘要:
从异构html中攫取良构信息到XML
1、href\\s*=\\s*
匹配href,其后面的=两侧有没有空格、有几个空格都可以。
2、(?:\"(?[^\"]*)\"|(?\\S+))
摘取数据1,即link,其两侧有没有引号都可以。
3、\\s+\\S+\\s+
匹配至少一个空各,紧接着至少一个非空格,紧接着至少一个空各。
其实匹配的是 target=_blank 阅读全文
posted @ 2005-10-16 22:07 civ3's .NET studying 阅读(656) 评论(1) 推荐(0) 编辑