摘要: 引言: 一个网络爬虫的编写主要可以分为三个部分: 1.获取网页 2.提取信息 3.分析信息 本文主要介绍第一部分,如何用Python内置的库urllib和第三方库requests库来完成网页的获取。阅读完本文后,读者将能利用这2个库获取一个网页的HTML代码。 但是首先,我们需要一点网络方面的基本知 阅读全文
posted @ 2018-03-14 13:57 pusidun 阅读(1009) 评论(0) 推荐(0) 编辑