记所内部“与顶级会议作者面对面”系列学术活动交流感受

所里面举办的学术交流活动链接:http://www.iscas.ac.cn/xwzx/kydt/201312/t20131217_4000026.html

隔了一个多月才总结感受,有点晚了,可能记录不全,慢慢回忆、总结。

第一个是Berkeley的Haoyuan Li博士,讲了两个报告Spark Streaming和Tachyon。从开始关注Matei的NSDI Best Paper中的RDD内存处理系统Spark开始便移至在关注AMPLab的开源系统进展了。到去年的HotCloud2012开始,Spark Streaming基本已经成型,逐渐集成到Spark 0.7.*版本里面。今年的SOSP发的D-Stream便是对Spark Streaming的细节详细描述了,整体来看Spark Streaming充分利用了内存计算的低延迟性以及空间换时间的思想加速流式数据的处理,以0.5s为一个间隔构建RDD进行计算,思想比较简单独到。个人认为系统在以周期段内处理势必会出现各种问题,可能有更有效的方式来解决Streaming实时处理。第二个系统是Tachyon(取名为超光的粒子~),简单来看,就是一个在各个framework之间共享只读内存块的存储系统,充分利用了Spark lineage容错思想,利用了Linux RamDisk系统级支持,击穿Spark多个task之间共享RDD计算,扩展到framework之间进行。个人想法,现阶段构建内存存储与计算系统是大数据处理趋势所在,Stanford的RAMCloud研究和Tachyon有很多相似的地方,前段看到12306的内存系统,以及hazelcast等是否有异曲同工。

报告之后,进入下午的会议室讨论阶段,总结一下来看,Berkeley的博士工作强度确实非常给力~Matei每天工作16小时(每周16*7),工作狂节奏,不是一般人能坚持下来。话说,师兄计算,每周100小时算100分,为了发论文至少及格60分(60小时/周=10小时/天)的论断,还是很鼓舞人心的O(∩_∩)O~~Haoyuan博士提到了Berkeley做科研的方法,就是和企业合作,每年举办两三次的技术发布会,企业进行投资参会以及对有兴趣的项目进行技术支持,这样的节奏还是很给力的。从做System来看,学术界和企业界的合作还是得多点的,这样优势互补,这方面国内还是做的落后了很多。然后,每个博士生做的第一个System必须是自己一个人,从架构到实现,全部一个人完成;后续的System才考虑合作,看来这样的锻炼还是不小的。个人感受,做System就得苦逼点,果断多投入时间coding吧。

第二个是Cornel的Qi Huang,主要讲的是对Facebook的Photo Caching System的架构介绍以及进行了相应改进的技术方案与实验结果。总体来看,SOSP给这篇论文的评价是有史以来分析的数据规模量最大的系统,从浏览器的cache,到重要图片cache,再到数据中心的cache,总体来看尽量减少用户到数据中心图片cache里面取数据,最终cache到数据中心的cache是15%左右。改进的方法是采用了构建已经抛弃多年的4级的缓存方式,方法显示老的方法用到新的大数据系统里面,效果还是很好的。个人想法,和企业的大规模系统结合分析,还是很容易出paper的,所以去大企业实习就得有效果O(∩_∩)O

报告之后,进入下午的会议室讨论阶段。Qi Huang博士,在这三位大牛之中看来是最接“地气”的了,呵呵,给了不少建议。个人总结一下,做System需要投入大量时间,基本上为了投SOSP,每天工作10小时,持续一年~这节奏。。每个人最好同时进行两个方向的研究,在一个方向上stuck了可以两个方向并行,这样不至于浪费所有时间在一个方向上了。做paper最好能够自己做一篇自己的paper,然后同时和其他人合作做另一篇paper,这样不至于有很大的压力。

第三个是Colmnbia的Heming Cui,大牛,很谦虚,基本上能够保持每年篇OSDI、SOSP,可望而不可及。做的是操作系统方向的多线程控制,用到模型检测方向。方向不太相关,内容上不详述~

报告之后,进入下午的会议室讨论阶段。大牛一般非常谦虚,在哥大的各种八卦。总体来看,还是那个词,时间。做System的,就得投入大量的时间,读大量paper和做大量的coding工作。提到看paper,Heming提到他的方法是对每一篇论文都细读,都要在论文上做很详细的标识,比如哪儿不好,哪儿好等,而且做到对最近几年所有相关和不相关的都需要进行阅读,提到了阅读的主要论文还是最近几年的顶级会议论文。 

总体先回忆这么多了,后续有了再进行添加。总结一下,就是多投入时间科研,多和大牛进行交流。必须要走出国门,看看外面的世界了。发paper~

posted @ 2014-01-01 21:00  MagicZhang  阅读(266)  评论(0编辑  收藏  举报