摘要: 参考网址:http://blog.csdn.net/Eastmount/article/details/51082253 常用正则表达式爬取网页信息及HTML分析总结 1.获取<tr></tr>标签之间内容 2.获取<a href..></a>超链接之间内容 3.获取URL最后一个参数命名图片或传递 阅读全文
posted @ 2017-12-07 20:52 小糊涂也学要编程 阅读(19980) 评论(2) 推荐(1) 编辑
摘要: 注释:使用re之前,要导入re库文件。 (1). :匹配任意字符,换行符 \n 除外;每个 . 表示一个占位符。 例子: a = 'xy123' b = re.findall('x..',a) print b 输出结果: (2)*:匹配前一个字符的0次或无限次。 例子: 输出结果为: (3)? :匹 阅读全文
posted @ 2017-12-07 20:29 小糊涂也学要编程 阅读(1818) 评论(0) 推荐(0) 编辑