随笔分类 -  Python爬虫

摘要:一、数据爬取与整理 1.1 数据来源:丁香园网站 1.2 爬取思路: 使用requests包发送get请求,获取响应的html页面(返回值类型为str) 扫描字符串使用正则表达式匹配出描述国内数据的html语句 去除多余字符并将匹配后结果整理成json文件 1.3 代码展示及文件说明: import 阅读全文
posted @ 2020-06-02 17:30 HOracle 阅读(3539) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示