2021 年 2月 25 日随笔档案 - btc

2021年2月25日

摘要：为了通过爬虫快速获取网站中的信息，我们通常将第一次爬取的网页中的url形成一个待爬取的列表为了访问网站以及对网站源代码进行分析，这里使用urllib的request库获取网页源代码，使用lxml库对网页进行结构分析。首先引用需要的库 import urllib.request import lx 阅读全文

posted @ 2021-02-25 14:39 btc 阅读(1292) 评论(0) 推荐(0) 编辑

btc

公告