随笔分类 - 正则表达式
摘要:在开发项目的过程,很多情况下我们需要利用互联网上的一些数据,在这种情况下,我们可能要写一个爬虫来爬我们所需要的数据。一般情况下都是利用正则表达式来匹配Html,获取我们所需要的数据。一般情况下分以下三步:1、获取网页的html2、利用正则表达式,获取我们所需要的数据3、分析,使用获取到的数据,(例如...
阅读全文
摘要:正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。常用的第三方正则库:http://regexkit.sourceforge.net/RegexKitLite/index.html匹配中文字符的正则表达式: [\u4e00-\u9fa5]评注:匹配中文还...
阅读全文