摘要:
参考网址:http://blog.csdn.net/Eastmount/article/details/51082253 常用正则表达式爬取网页信息及HTML分析总结 1.获取<tr></tr>标签之间内容 2.获取<a href..></a>超链接之间内容 3.获取URL最后一个参数命名图片或传递 阅读全文
摘要:
注释:使用re之前,要导入re库文件。 (1). :匹配任意字符,换行符 \n 除外;每个 . 表示一个占位符。 例子: a = 'xy123' b = re.findall('x..',a) print b 输出结果: (2)*:匹配前一个字符的0次或无限次。 例子: 输出结果为: (3)? :匹 阅读全文