摘要: 解决方案:一直以来,基于Akka实现的RPC通信框架是Spark引以为豪的主要特性,也是与Hadoop等分布式计算框架对比过程中一大亮点。 但是时代和技术都在演化,从Spark1.3.1版本开始,为了解决大块数据(如Shuffle)的传输问题,Spark引入了Netty通信框架,到了1.6.0版本, 阅读全文
posted @ 2018-09-27 19:54 大数据从业者FelixZh 阅读(2170) 评论(0) 推荐(0) 编辑
摘要: NameNode与Secondary NameNode 很多人都认为,Secondary NameNode是NameNode的备份,是为了防止NameNode的单点失败的,其实并不是在这样。文章Secondary Namenode - What it really do? (需FQ)写的很通俗易懂, 阅读全文
posted @ 2018-09-27 19:36 大数据从业者FelixZh 阅读(1914) 评论(0) 推荐(0) 编辑
摘要: 原因: Ambari 每分钟会向datanode发送"ping"连接一下去确保datanode是正常工作的.否则它会触发alert。但是datanode并没有处理空内容的逻辑,所以直接异常了 解决办法: 这个可以忽略,或者使用 https://issues.apache.org/jira/brows 阅读全文
posted @ 2018-09-27 10:47 大数据从业者FelixZh 阅读(769) 评论(0) 推荐(0) 编辑
摘要: 今天用一个停车场问题来加深对Disruptor的理解。一个有关汽车进入停车场的问题。当汽车进入停车场时,系统首先会记录汽车信息。同时也会发送消息到其他系统处理相关业务,最后发送短信通知车主收费开始。看了很多文章,里面的代码都是大同小异的,可能代码真的是很经典。以下代码也是来源网络,只是自己手动敲的, 阅读全文
posted @ 2018-09-27 09:23 大数据从业者FelixZh 阅读(2415) 评论(0) 推荐(0) 编辑
摘要: 一个仅仅部署在4台服务器上的服务,每秒向Database写入数据超过100万行数据,每分钟产生超过1G的数据。而每台服务器(8核12G)上CPU占用不到100%,load不超过5。这是怎么做到呢?下面将给你描述这个架构,它的核心是一个高效缓冲区设计,我们对它的要求是: 1,该缓存区要尽量简单 2,尽 阅读全文
posted @ 2018-09-27 09:20 大数据从业者FelixZh 阅读(1208) 评论(0) 推荐(0) 编辑
摘要: 相对于无锁技术,Disruptor对于架构思维的转变,才是其最大亮点。 Pub Event 说到RingBuffer做的队列,通常都说的是“一读一写“,或者“多读一写“。而Disruptor天生是为“广播“设计,也就是1个Producer,多个Consumer消费同1条消息。 有了“广播“,就能很好 阅读全文
posted @ 2018-09-27 09:08 大数据从业者FelixZh 阅读(423) 评论(0) 推荐(0) 编辑
摘要: 背景 Disruptor是英国外汇交易公司LMAX开发的一个高性能队列,研发的初衷是解决内存队列的延迟问题(在性能测试中发现竟然与I/O操作处于同样的数量级)。基于Disruptor开发的系统单线程能支撑每秒600万订单,2010年在QCon演讲后,获得了业界关注。2011年,企业应用软件专家Mar 阅读全文
posted @ 2018-09-27 09:03 大数据从业者FelixZh 阅读(490) 评论(0) 推荐(0) 编辑