hadoop日志【5】----存储迁移之后
集群使用的是一台实体加5台虚拟(分布在两台实体机上)
后来实体机的存储不够用了,就把虚拟机转移到了网络存储上
然后就悲剧了
性能急剧下降
是实体机网卡的瓶颈造成的
原来在实体机的时候,虚拟机在进行hadoop运算时只需要走一个相互间的通信
然而,在迁移到网络存储以后,则多了一个过程,既要进行相互间的通信,还多了一个网络存储的过程,编程了如下
虚拟机A==》A的网络存储==》虚拟机A==》虚拟机B==》B的网络存储==》虚拟机B..........................
理解hadoop计算过程的话就会明白这回增加多少的网卡负荷,结果瓶颈在了网卡上
这就使得以内存作为缓存的量急剧增加,机器在监控软件上一片彪红~~~
最可怕的是计算过程增加很多
另外,4G的机器作为DataNode,确实伤不起