摘要: 为了通过爬虫快速获取网站中的信息,我们通常将第一次爬取的网页中的url形成一个待爬取的列表 为了访问网站以及对网站源代码进行分析,这里使用urllib的request库获取网页源代码,使用lxml库对网页进行结构分析。 首先引用需要的库 import urllib.request import lx 阅读全文
posted @ 2021-02-25 14:39 btc 阅读(1243) 评论(0) 推荐(0) 编辑