2017 年 1月 14 日随笔档案 - Mr_Cxy

2017年1月14日 #

Python 2.7_爬取妹子图网站单页测试图片_20170114

摘要： 1、url= http://www.mzitu.com/74100/x，2为1到23的值 2、用到模块 os 创建文件目录; re模块正则匹配目录名图片下载地址; time模块限制下载时间;requests模块获取网页源代码;urllib模块 urllib.urlretrieve(图片url,保阅读全文

posted @ 2017-01-14 13:03 Mr_Cxy 阅读(264) 评论(0) 推荐(0) 编辑

Python 2.7_爬取CSDN单页面利用正则提取博客文章及url_20170114

摘要：年前有点忙,没来的及更博,最近看爬虫正则的部分巩固下 1.爬取的单页面：http://blog.csdn.net/column/details/why-bug.html 2.过程解析url获得网站源代码 3.找到文章标题列表和文章url(a标签下’href'属性）组成列表 4.for循环取出 # 阅读全文

posted @ 2017-01-14 10:02 Mr_Cxy 阅读(276) 评论(0) 推荐(0) 编辑

Mr_Cxy

导航

公告

Python 2.7_爬取妹子图网站单页测试图片_20170114

Python 2.7_爬取CSDN单页面利用正则提取博客文章及url_20170114