会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Riy
博客园
首页
新随笔
联系
订阅
管理
2020年2月27日
python爬取某站新闻,并分析最近新闻关键词
摘要: 在爬取某站时并做简单分析时,遇到如下问题和大家分享,避免犯错: 一丶网站的path为 /info/1013/13930.htm ,其中13930为不同新闻的 ID 值,但是这个数虽然为升序,但是没有任何规律的升序。 解决办法: 使用 range 顺序爬取,错误的网站在页面会报如图错误: 这时我们首先
阅读全文
posted @ 2020-02-27 13:27 riyir
阅读(4445)
评论(0)
推荐(0)
编辑
公告