2017 年 12月 7 日随笔档案 - 小糊涂也学要编程

2017年12月7日

摘要：参考网址：http://blog.csdn.net/Eastmount/article/details/51082253 常用正则表达式爬取网页信息及HTML分析总结 1.获取<tr></tr>标签之间内容 2.获取<a href..></a>超链接之间内容 3.获取URL最后一个参数命名图片或传递阅读全文

posted @ 2017-12-07 20:52 小糊涂也学要编程阅读(20444) 评论(2) 推荐(1) 编辑

Python爬虫正则表达式常用符号和方法

摘要：注释：使用re之前，要导入re库文件。（1）. ：匹配任意字符，换行符 \n 除外；每个 . 表示一个占位符。例子： a = 'xy123' b = re.findall('x..',a) print b 输出结果：（2）*：匹配前一个字符的0次或无限次。例子：输出结果为：（3）? ：匹阅读全文

posted @ 2017-12-07 20:29 小糊涂也学要编程阅读(1824) 评论(0) 推荐(0) 编辑

小糊涂也学要编程

公告