摘要: 日志分析 从10000条数据中统计各个浏览器占比,数据格式如下 难点: 1.从每一行中找到描述浏览器信息的字符串; 2.从这字符串中解析出浏览器; 解决: 1.多观察可以发现,每一行在第七个“ " ”之后的字符串为浏览器信息,可以通过以下方式获取 2.使用GitHub上现成的工具UserAgentP 阅读全文
posted @ 2018-07-19 08:54 遗风遗风丶 阅读(151) 评论(0) 推荐(0) 编辑
摘要: MapReduce倒排索引 代码: MyMapper.java MyCombiner.java MyReducer.java MyJob.java 结果: 阅读全文
posted @ 2018-07-19 08:25 遗风遗风丶 阅读(114) 评论(0) 推荐(0) 编辑