摘要: 工具:python3.6 pycharm 库:bs4 + urllib 第一步:读取html源码 第二步:获取内容和标题 第三步:在当前目录下新建一个lesson的文件夹,将文件存储在此文件夹下 数据爬取完毕。 注:以上完成一个页面的抓取,若想多抓取页面的话,可用以下代码: 阅读全文
posted @ 2018-08-09 23:05 o云淡风轻o 阅读(651) 评论(0) 推荐(0) 编辑