正则查找文章内容关键字

用于敏感词,或关键字加连接之类。

比如关键字为a

如果单纯匹配a,则会把<a></a> <table>这些html标签内的也匹配上

如不希望匹配<>中间的内容可以使用

(?<!<[^>]*?)a(?![^<]*?>)

(?<!pattern)反向否定

(?!pattern)正向否定

image

测试的匹配结果

 

<style>…</style>

<script>…</script>

这类的就很烦人了。

敏感词,用这个就能匹配出来了

但是如果是关键字加连接,还得继续判断匹配的是否在<a></a>之间,原理和这个差不多了

posted @ 2012-08-15 11:11  czcz1024  阅读(322)  评论(0编辑  收藏  举报