2011 年 10月 5 日随笔档案 - 星月磊子

2011年10月5日

摘要：经典正则表达式(希望给自己和大家带来便利，方便查找) 摘要：收集一些常用的正则表达式。引自：http://blog.holybbs.com/article.asp?id=284 另外一篇参考文档(介绍的很系统,推荐阅读)：http://oo8h.51.net/docs/regular_expression.htm 正则表达式用于字符串处理，表单验证等场合，实用高效，但用到时总是不太把握，以致往往要上网查一番。我将一些常用的表达式收藏在这里，作备忘之用。本贴随时会更新。匹配中文字符的正则表达式： [\u4e00-\u9fa5] 匹配双字节字符(包括汉字在内)：[^\x00-\xff] 应用：阅读全文

posted @ 2011-10-05 11:18 星月磊子阅读(500) 评论(1) 推荐(0) 编辑

网页信息抓取抓取博客园的文章标题和链接

摘要：本文将以抓取博客园首页的博客标题和链接为例：上图显示的是博客园首页的DOM树，显然只需提取出class为post_item的div，再重中提取出class为titlelnk的a标志即可。这样的功能可以通过以下函数来实现：/// <summary>/// 在文本html的文本查找标志名为tagName,并且属性attrName的值为attrValue的所有标志/// 例如：FindTagByAttr(html, "div", "class", "demo")/// 返回所有class为demo的div标志/// </s 阅读全文

posted @ 2011-10-05 11:16 星月磊子阅读(675) 评论(2) 推荐(0) 编辑

asp.net的sql防注入和去除html标记的函数

摘要： // <summary> /// 过滤标记 /// </summary> /// <param name="NoHTML">包括HTML，脚本，数据库关键字，特殊字符的源码 </param> /// <returns>已经去除标记后的文字</returns> public static string NoHTML(string Htmlstring) { if (Htmlstring == null) { return ""; } else { //删除脚本 Htmlstring = 阅读全文

posted @ 2011-10-05 11:09 星月磊子阅读(374) 评论(0) 推荐(0) 编辑

星月磊子

公告