爬取网页汽车销量

爬取网页汽车销量

源代码:https://github.com/Dalaska/Webcrawler
发现车主之家网站上的汽车销量信息保存下来。想通过爬虫保存到csv
源代码

步骤:

  1. 获取html内容。现在很多网站上有反爬虫机制,用request url会没有相应。所以直接把网页html下载下来。

  2. 采用beautifulsoup。将html信息解析成obj。打开html查看数据的格式。
    "销量"是在下。从obj中取出数据
    text

  3. 保存数据到csv
    text

posted @ 2020-04-23 20:33  dalaska  阅读(599)  评论(0编辑  收藏  举报