随笔分类 - python
摘要:恢复内容开始 课程地址: http://study.163.com/course/courseMain.htm?courseId=1003285002 这里有不同的包,接下来确定哪个包是要爬取页面的内容 将上图中response标签下的内容与网页中的内容比对,如下: 将爬取内容在记事本中ctrl+f
阅读全文
摘要:实战演练:爬取百度百科1000个页面的数据 对于新手来说,可以把spider_main.py代码中的try和except去掉,运行报错就会在控制台出现,根据错误去调试自己的程序 发现以下错误: requests.exceptions.TooManyRedirects: Exceeded 30 red
阅读全文
摘要:test_urllib2.py test_bs4.py:
阅读全文