2014 年 9月 12 日随笔档案 - frankbadpot

2014年9月12日

摘要：看了Spark Summit 2014的A Deeper Understanding of Spark Internals，视频（要科学上网）详细讲解了Spark的工作原理，Slides的45页给原始算法和优化算法。破砂锅用自己3节点的Spark集群试验了这个优化算法，并进一步找到更快的算法。测试数据是Sogou实验室的日志文件前10000000条数据。目标是对日志第2列数据，按照第一个字母合并，得到每个首字母有几条记录。阅读全文

posted @ 2014-09-12 21:34 frankbadpot 阅读(13597) 评论(1) 推荐(1) 编辑

公告

昵称： frankbadpot
园龄： 15年4个月
粉丝： 4
关注： 1

+加关注

2025年3月

日

一

二

三

四

五

六

破锅堂

打破砂锅问到底

公告

搜索

我的标签

随笔档案

阅读排行榜

推荐排行榜

最新评论