摘要:
从爬取一页数据到爬取所有数据 先说一下静态网页爬虫的大概流程 数据加载方式 通过点击第二页发现,网站后面多了 ?start=25 字段 这部分被称为 查询字符串,查询字符串作为用于搜索的参数或处理的数据传送给服务器处理,格式是 ?key1=value1&key2=value2。 我们多翻几页豆瓣读书 阅读全文
摘要:
解析数据 通过在命令行中输入 pip install beautifulsoup4 安装 BeautifulSoup 我们通过 from bs4 import BeautifulSoup 语句导入 BeautifulSoup,然后使用 BeautifulSoup(res.text, 'html.pa 阅读全文