会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Fanchuguang
导航
博客园
首页
新随笔
联系
订阅
管理
公告
2018年4月30日
爬虫大作业
摘要: 本人选取的主题是电影。 本次爬取的网址是电影票房网:http://58921.com/alltime?page=0 一、查看网页结构,我们需要先爬取排行榜中电影的链接 可以看到每一电影由'.media-body'装着,所以可以获取其标题连接: 进入电影详情界面,查看页面结构 可以看出导演是在第二个l
阅读全文
posted @ 2018-04-30 21:04 范楚广
阅读(444)
评论(0)
推荐(0)
编辑