摘要: 经典正则表达式(希望给自己和大家带来便利,方便查找) 摘要:收集一些常用的正则表达式。 引自:http://blog.holybbs.com/article.asp?id=284 另外一篇参考文档(介绍的很系统,推荐阅读):http://oo8h.51.net/docs/regular_expression.htm 正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番。我将一些常用的表达式收藏在这里,作备忘之用。本贴随时会更新。 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 匹配双字节字符(包括汉字在内):[^\x00-\xff] 应用: 阅读全文
posted @ 2011-10-05 11:18 星月磊子 阅读(497) 评论(1) 推荐(0) 编辑
摘要: 本文将以抓取博客园首页的博客标题和链接为例:上图显示的是博客园首页的DOM树,显然只需提取出class为post_item的div,再重中提取出class为titlelnk的a标志即可。这样的功能可以通过以下函数来实现:/// <summary>/// 在文本html的文本查找标志名为tagName,并且属性attrName的值为attrValue的所有标志/// 例如:FindTagByAttr(html, "div", "class", "demo")/// 返回所有class为demo的div标志/// </s 阅读全文
posted @ 2011-10-05 11:16 星月磊子 阅读(667) 评论(2) 推荐(0) 编辑
摘要: // <summary> /// 过滤标记 /// </summary> /// <param name="NoHTML">包括HTML,脚本,数据库关键字,特殊字符的源码 </param> /// <returns>已经去除标记后的文字</returns> public static string NoHTML(string Htmlstring) { if (Htmlstring == null) { return ""; } else { //删除脚本 Htmlstring = 阅读全文
posted @ 2011-10-05 11:09 星月磊子 阅读(373) 评论(0) 推荐(0) 编辑