会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
九离
博客园
首页
新随笔
联系
管理
订阅
2020年2月1日
信件分析实战(二)——爬取信件第二步简单清洗数据
摘要: 继上次爬取完总体数据之后,这次我做的是将每个信件的网址使用MapReduce进行清洗出来,进而爬取出进一步的数据。 通过观察所得该网站根据不同的信件类型有不同的网址其对应关系如下: 咨询 com.web.consult.consultDetail.flow 建议 com.web.suggest.su
阅读全文
posted @ 2020-02-01 17:08 九离
阅读(438)
评论(0)
推荐(0)
编辑
公告