Mr_Cxy

导航

2017年1月14日 #

Python 2.7_爬取妹子图网站单页测试图片_20170114

摘要: 1、url= http://www.mzitu.com/74100/x,2为1到23的值 2、用到模块 os 创建文件目录; re模块正则匹配目录名 图片下载地址; time模块 限制下载时间;requests模块获取网页源代码;urllib模块 urllib.urlretrieve(图片url,保 阅读全文

posted @ 2017-01-14 13:03 Mr_Cxy 阅读(263) 评论(0) 推荐(0) 编辑

Python 2.7_爬取CSDN单页面利用正则提取博客文章及url_20170114

摘要: 年前有点忙,没来的及更博,最近看爬虫正则的部分 巩固下 1.爬取的单页面:http://blog.csdn.net/column/details/why-bug.html 2.过程 解析url获得网站源代码 3.找到文章标题列表和文章url(a标签下’href'属性)组成列表 4.for循环取出 # 阅读全文

posted @ 2017-01-14 10:02 Mr_Cxy 阅读(273) 评论(0) 推荐(0) 编辑