摘要:
软件设计的基本原则是道,范式及其背后的模式是术。 阅读全文
摘要:
一个小小的方差增量算法,使得消除持续增长的上百GB的明细数据成为可能,空间效率和时间效率都可得到无以伦比的提升。 阅读全文
摘要:
在商业项目开发过程中,经常会碰到“加个需求,到处改代码”的情况,也就是 散弹式修改 ,典型后果是漏改某些地方,导致整个系统表现不一致。 阅读全文
摘要:
为什么即便是经验丰富的程序员写出的程序,也会有违背职责单一原则的代码存在?职责单一原则是一门不断发展的艺术,值得你不断学习和参悟。 阅读全文
摘要:
道法自然,面向对象的代码也讲究自然。一个商业项目的代码会维护较长时间,人要读很多次,所以写代码一定要讲人话。 阅读全文
摘要:
RDD的粗粒度的转换是否有足够的表达能力,来支持多种多样的应用需求呢?一起来看看如何模拟Google经典的MapReduce和图数据处理框架Pregel。 阅读全文
摘要:
代码质量取决于程序员的素养,而代码质量几乎反应了程序员的素养。 阅读全文
摘要:
Spark究竟适用于哪些场景?RDD为何要设计成只读的?RDD为啥只支持粗粒度转换?RDD都放内存中了咋个容错?进来看看吧。 阅读全文
摘要:
当你看到别人写的超过千行的巨无霸类,以及随着时间的累积,自己写的类也稳步迈向巨无霸的时候,是不是既恐惧又无奈?一码今天就带小伙伴们征服巨无霸,打造属于自己的成就感。 阅读全文
摘要:
大数据处理肯定是分布式的了,那就面临着几个核心问题:可扩展性,负载均衡,容错处理。Spark是如何处理这些问题的呢? 阅读全文
摘要:
对于新手而言,很困恼面向对象的程序中完全找不到计算逻辑,反而是无穷无尽的方法调用,但是当你习惯面向对象后就会了解到短方法的价值所在。 阅读全文
摘要:
寥寥10多行代码,就已经完成了,比大家想象的要简单,完全看不出大数据背后的存储,分布式,容错处理,这就是Spark给我们带来的福利。 阅读全文
摘要:
大家都习惯了这些打开软件的方式,习惯归习惯,它高效吗? 阅读全文
摘要:
解决重复并不困难,困难的是发现重复。发现重复并不困难,困难是培养发现重复的习惯。 阅读全文
摘要:
《高效法则》会带着大家沿着大师的步伐,重温各个高效法则,并用目前最新可用的工具进行解说。 阅读全文