【Python爬虫】手刃豆瓣近十多年电影排行数据!

源码见我github仓库:https://github.com/xzajyjs/Python_FilmInfo_reptile

爬取豆瓣上2009-2021年共13年的年度电影排行榜数据,可全自动爬取,爬取内容如下:

  • 电影名称
  • 电影分类
  • 电影上映日期
  • 电影票房

已知问题:部分年份的个别电影的票房信息会有少许错误


源码中默认是爬取2009-2021所有年份的信息,如只需要部分年份,只需注释掉 line 42-47,将line 50-62中需要的年份取消注释即可。

posted @   xzajyjs  阅读(187)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
点击右上角即可分享
微信分享提示