【Python爬虫】手刃豆瓣近十多年电影排行数据!

源码见我github仓库:https://github.com/xzajyjs/Python_FilmInfo_reptile

爬取豆瓣上2009-2021年共13年的年度电影排行榜数据,可全自动爬取,爬取内容如下:

  • 电影名称
  • 电影分类
  • 电影上映日期
  • 电影票房

已知问题:部分年份的个别电影的票房信息会有少许错误


源码中默认是爬取2009-2021所有年份的信息,如只需要部分年份,只需注释掉 line 42-47,将line 50-62中需要的年份取消注释即可。

posted @ 2021-12-20 01:02  xzajyjs  阅读(167)  评论(0编辑  收藏  举报