随笔分类 -  正则表达式

摘要:在开发项目的过程,很多情况下我们需要利用互联网上的一些数据,在这种情况下,我们可能要写一个爬虫来爬我们所需要的数据。一般情况下都是利用正则表达式来匹配Html,获取我们所需要的数据。一般情况下分以下三步:1、获取网页的html2、利用正则表达式,获取我们所需要的数据3、分析,使用获取到的数据,(例如... 阅读全文
posted @ 2014-08-03 11:02 jack_ou 阅读(1488) 评论(1) 推荐(1) 编辑
摘要:正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。常用的第三方正则库:http://regexkit.sourceforge.net/RegexKitLite/index.html匹配中文字符的正则表达式: [\u4e00-\u9fa5]评注:匹配中文还... 阅读全文
posted @ 2014-08-03 10:59 jack_ou 阅读(851) 评论(2) 推荐(1) 编辑