2020年4月14日

日志信息和浏览器信息获取及数据过滤

摘要: 注:图片如果损坏,点击文章链接:https://www.toutiao.com/i6815135249589076493/ 承接上一个课件《分析Nginx日志获取IP地址的省份信息》 现在希望是获取浏览器和操作系统相关数据 准备一个工具类UserAgentUtil 编写代码 解析浏览器的userag 阅读全文

posted @ 2020-04-14 10:50 那山的狐狸 阅读(342) 评论(0) 推荐(0) 编辑

Spark词频前十的统计练习

摘要: 注:图片如果损坏,点击文章链接:https://www.toutiao.com/i6815390070254600712/ 承接上一个文档《Spark本地环境实现wordCount单词计数》 进一步延伸,做一个词频前十的统计练习 逻辑:在reduceByKey的基础上,首先要根据key对应的valu 阅读全文

posted @ 2020-04-14 10:47 那山的狐狸 阅读(352) 评论(0) 推荐(0) 编辑

Spark-local本地环境搭建

摘要: 注:图片如果损坏,点击文章链接:https://www.toutiao.com/i6815385772254822919/ 承接上一个文档《Spark源码编译》 解压spark编译好的压缩包 sudo tar -zxvf spark-2.0.2-bin-2.7.3.tgz -C /opt/bigda 阅读全文

posted @ 2020-04-14 10:41 那山的狐狸 阅读(713) 评论(0) 推荐(0) 编辑

导航