03 2016 档案

摘要:python urllib2使用心得 1、http GET请求 过程:获取返回结果,关闭连接,打印结果 2、http GET请求 + 包头 3、http GET请求 + 包头,处理返回响应包头 4、http POST请求 5、http POST请求 + 包头 6、http POST请求 + 包头,处 阅读全文
posted @ 2016-03-31 15:57 shhnwangjian 阅读(959) 评论(0) 推荐(0) 编辑
摘要:scrapy入门 四步: 1. 创建一个新的Scrapy Project 2. 定义你需要从网页中提取的元素Item 3. 实现一个Spider类,通过接口完成爬取URL和提取Item的功能 4. 实现一个Item PipeLine类,完成Item的存储功能 新建工程 首先,为我们的爬虫新建一个工程 阅读全文
posted @ 2016-03-29 14:42 shhnwangjian 阅读(2492) 评论(1) 推荐(0) 编辑
摘要:PhantomJS PhantomJS 是一个基于WebKit的服务器端JavaScript API,它无需浏览器的支持即可实现对Web的支持,且原生支持各种Web标准,如DOM 处理、JavaScript、CSS选择器、JSON、Canvas和可缩放矢量图形SVG。PhantomJS主要是通过Ja 阅读全文
posted @ 2016-03-29 14:16 shhnwangjian 阅读(880) 评论(0) 推荐(0) 编辑
摘要:Spynner 安装 Windows7 下安装 1、easy_install spynner 2、下载pyqt sip https://sourceforge.net/projects/pyqt/files/sip python configure.py 在Visual Studio的开发人员命令提 阅读全文
posted @ 2016-03-10 16:35 shhnwangjian 阅读(975) 评论(0) 推荐(0) 编辑
摘要:python Scrapy安装和介绍 Windows7下安装 1、执行easy_install Scrapy Centos6.5下安装 1、库文件安装yum install libxslt-devel libxml2-devel 2、将系统自带python2.6的easy_install备份,使用p 阅读全文
posted @ 2016-03-04 10:07 shhnwangjian 阅读(418) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示