摘要: 2016年9月22日10:34:02一、Selector1.如何构建(1)text构建: body = '<html><body><span>good</span></body></html>' Selector(text=body).xpath('//span/text()').extract() 阅读全文
posted @ 2016-09-23 20:05 AlloCai 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 2016年9月21日09:21:431.爬虫的抓取周期:(1)首先生成初始请求爬第一个url,并指定一个回调函数被称为与下载这些请求的响应。(2)第一个请求执行通过调用 start_requests()方法(默认情况下)生成 Request中指定的url start_urls和 parse方法作为请 阅读全文
posted @ 2016-09-21 21:12 AlloCai 阅读(444) 评论(0) 推荐(0) 编辑
摘要: 一、Scrapy环境的安装 1.配套组件的安装 由于开发环境是在VS2015Community中编码,默认下载的python3.5,系统是windows8.1,为此需要安装的组件有如下列表: 所有的组件在pip、easy_install或者可执行exe无法安装时,使用下面的安装方法, (1)pywi 阅读全文
posted @ 2016-09-20 22:41 AlloCai 阅读(728) 评论(0) 推荐(0) 编辑
摘要: 2016-09-10 PythonCrawl自学日志 1.python及Selenium的安装 (1)开发环境使用的是VS2015 Community、python3.5、Selenium3.0BETA2、FireFox47 (2)cmd命令下使用pip3 install selenium,就可以安 阅读全文
posted @ 2016-09-10 19:20 AlloCai 阅读(478) 评论(0) 推荐(0) 编辑