Mr_Cxy

导航

2016年12月7日 #

Python 2.7_Second_try_爬取阳光电影网_获取电影下载地址并写入文件 20161207

摘要: 1、昨天文章http://www.cnblogs.com/Mr-Cxy/p/6139705.html 是获取电影网站主菜单 然后获取每个菜单下的电影url 2、今天是对电影url 进行再次解析获取下载地址 并写入文件 4、python 代码 阅读全文

posted @ 2016-12-07 22:16 Mr_Cxy 阅读(652) 评论(0) 推荐(0) 编辑

Python 2.7_First_try_爬取阳光电影网_20161206

摘要: 之前看过用Scrapy 框架建立项目爬取 网页解析时候用的Xpath进行解析的网页元素 这次尝试用select方法匹配元素 1、入口爬取页面 http://www.ygdy8.com/index.html 2、用到模块 requests(网页源码下载) BeautifulSoup4(网页解析) 3、 阅读全文

posted @ 2016-12-07 00:19 Mr_Cxy 阅读(800) 评论(0) 推荐(0) 编辑