一些比较好的博客
许鹏
http://www.cnblogs.com/hseagle/
C程序员的修养、大型项目的源码学习,以及Spark和Storm的源码走读。
http://www.csdn.net/article/2014-06-05/2820092-interview-with-pengxu
大数据计算新贵Spark在腾讯雅虎优酷成功应用解析
http://www.csdn.net/article/2014-06-05/2820089
许鹏:从零开始学习,Apache Spark源码走读(一)
http://www.csdn.net/article/2014-05-29/2820013
15个具有高度影响力的Apache开源项目
http://news.cnw.com.cn/news-SlideShow/htm2013/20130314_265736.shtml
真正统治世界的十大算法