10 2019 档案

摘要:本文基于 Spark 2.4.1 进行演示,相关代码可以在我的Github上看到。 简介 Spark是一个分布式集群计算系统,类似Hadoop提供了强大的分布式计算能力,相比过去的批量处理系统,提供了处理更大规模数据的能力。Spark提供了Java、Python、Scala、R接口。除常见的MapR 阅读全文
posted @ 2019-10-15 13:16 Cocowool 阅读(166) 评论(0) 推荐(0) 编辑
摘要:简介 Metric是一个第三方包,用来帮助我们对应用程序的性能进行度量。曾有友商基于这个包编写的程序还申请了专利,总之这是一个使用方便的组件。我们日常进行应用程序性能度量时,最常用的方法是打日志记录每个交易的一些耗时数据,有了这些原始数据,自己再进行统计分析。通过使用Metrics这个包,我们可以很 阅读全文
posted @ 2019-10-09 20:26 Cocowool 阅读(6820) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示