随笔分类 -  python

摘要:恢复内容开始 课程地址: http://study.163.com/course/courseMain.htm?courseId=1003285002 这里有不同的包,接下来确定哪个包是要爬取页面的内容 将上图中response标签下的内容与网页中的内容比对,如下: 将爬取内容在记事本中ctrl+f 阅读全文
posted @ 2018-01-21 22:48 twoheads 阅读(715) 评论(0) 推荐(0) 编辑
摘要:实战演练:爬取百度百科1000个页面的数据 对于新手来说,可以把spider_main.py代码中的try和except去掉,运行报错就会在控制台出现,根据错误去调试自己的程序 发现以下错误: requests.exceptions.TooManyRedirects: Exceeded 30 red 阅读全文
posted @ 2018-01-20 19:51 twoheads 阅读(520) 评论(0) 推荐(0) 编辑
摘要:test_urllib2.py test_bs4.py: 阅读全文
posted @ 2018-01-20 14:23 twoheads 阅读(295) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示