摘要: 上一节中对网络爬虫的学习的准备工作作了简要的介绍,并以一个简单的网页爬取为例子。但网络是十分复杂的,对网站的访问并不一定都会成功,因此需要对爬取过程中的异常情况进行处理,否则爬虫在遇到异常情况时就会发生错误停止运行。 让我们看看urlopen中可能出现的异常: html = urlopen("htt 阅读全文
posted @ 2016-06-22 19:13 CoderInCV 阅读(2085) 评论(1) 推荐(1) 编辑
摘要: 网络爬虫是根据一定的规则自动的对网络信息进行抓取,为了对爬虫有更深的了解,学习爬虫前有必要先了解一下一个网页打开的完整过程,可以参考http://blog.csdn.net/saiwaifeike/article/details/8789624 接下来就是需要安装和了解常用的2个相关库,一个是url 阅读全文
posted @ 2016-06-22 16:42 CoderInCV 阅读(673) 评论(0) 推荐(0) 编辑