2013 年 4月随笔档案 - JerryLead - 博客园

04 2013 档案

友情序言 to 《Learning Spark: Lightning-fast big data analytics》

摘要：友情序言获悉Spark最近要出书了，突然有很多感慨，心想不如写点东西出来，算是友情支持，也算是个人总结。观点尽量中立，内容尽量煽情。本着牛哥“站在巨人的肩膀上”的理论，在捧Spark之前，要先捧一下她的前辈们。大数据系统中最核心的莫过于分布式处理框架，因为框架负责job执行的方方面面，如job分解、task调度与执行、错误容忍、数据流等等。较早（04年发表）也是最重要的贡献是Google的MapReduce框架，她将函数式编程思想引入到分布式数据处理中，仅仅用两个函数（map和reduce）就解决了一大类的大数据批处理问题，用户也再也不用担心分布式带来的诸多系统层面问题。MapReduce缺点阅读全文

posted @ 2013-04-27 13:07 JerryLead 阅读(21327) 评论(4) 推荐(7) 编辑

公告

Contact me via

昵称： JerryLead
园龄： 14年
粉丝： 2920
关注： 5

导航

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

统计

随笔 - 28
文章 - 0
评论 - 470
阅读 - 278万

随笔档案 (28)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:偏最小二乘法回归（Partial Least Squares Regression）
感谢分享！学习中
--364097727
2. Re:支持向量机（五）SMO算法
讨论a1与a2的直线的地方，因为a1与a2是对称的，所以最好带上y1和y2
--林北林奈
3. Re:独立成分分析（Independent Component Analysis）
同求代码
--222222233344
4. Re:典型关联分析（Canonical Correlation Analysis）
博主您好，有个问题想问一下，在求出特征向量并排序之后，在限定条件下求解m，并将对应特征向量*m，这个存在符号+-的问题吗？我写了一个CCA程序，和matlab程序传入相同的数据，输出的特征向量存在符号...
--阿土dfgdsfga
5. Re:（EM算法）The EM Algorithm
L(θ)是通过求导数为0得到下一次更新的，那么L(θ)收敛到局部最大值，而不是全局最大值这种情况是否也会发生，若是该怎么处理呢？
--努力吧少年666