摘要: 爬虫固定套路 1.提取数据(1.找到需要爬取的url,通过http请求获取html页面) 2.解析数据(1.数据筛选,2.数据过滤,3.获取有效数据) 最难搞的就是这一步,因为你要去分析解析人家前端页面Html的格式,这里也就是爬虫功放战的主要战场 3.数据入库 一、提取数据 1.找到需要爬取页面的 阅读全文
posted @ 2020-06-22 12:03 12不懂3 阅读(253) 评论(0) 推荐(0) 编辑
创作不易,请勿抄袭,欢迎转载!