12 2012 档案
HBase行锁探索
摘要:https://github.com/sgp2004/JavaTools代码地址HBase客户端的行锁会对相同rowkey的读写造成很大影响,同一个进程并发更新rowkey的计数有可能造成阻塞(场景 热门短链点击增加 热门微博评论数).例如一个线上问题:转发微博抱歉,此微博已被作者删除。查看帮助:http://t.cn/zWSudZc| 转发| 收藏| 评论所有被删除的微博里短链被引用的计数要减一,结果因为微博内容删除,只剩一个帮助短链,计数都减到帮助短链里,导致服务器响应缓慢分析行锁关键代码总结一下:client端:1 HTable类代码,发现lockRow 和 unlockRow方法都没有
阅读全文
HBase 异步查询导致的死锁和zookeeper通信中断问题追踪与总结[非技术]
摘要:机房T和机房Y共十台前端机,Y机房请求量是T的两倍,主要用于数据查询,开始问题是Y机房tomcat 相继僵死1) tomcat僵死处理步骤a 检查代码,发现read through后,没有把DB数据写到缓存,增加回写代码;但单台机器每秒请求也就几十条,HBase压力很小,最终发现无效。b 检查代码,认为跟运行几个月的动态代码在HBase使用上完全一致,所以认为业务代码层没有问题;打印堆栈信息,认为是HBase client端发现资源等待死锁的问题c 下载0.94.2 patch,分析认为其解决了死锁问题,更新jar包部署。第二周发现tomcat 日志疯狂报Interrupted错误,进程没有僵
阅读全文
上周回顾 - 2012年11.26-12.4
摘要:1 周二当天各种问题#史上最倒霉一天#早起开电脑,发现电源插槽不行,换到空调插槽凑合用,打开电脑发现无线路由不行,在室友屋里不好打扰,就出门了;下午连充电器,发现笔记本不行,充不上电;跑到三里屯发现genius不行,还得预约技术人员来修,白跑一趟;出来还没下地铁,发现线上业务不行了,又跑回来查问题至今!!!用了一周台式电脑,效率严重受影响。修电脑费用是4500,够买个单电了,幸亏还在保修期,必须买个苹果care2 看完了一本莎士比亚,连续早起一个月多月罗密欧朱丽叶 凯撒 麦克白习惯简直有一种改变气质的神奇的力量,它可以制服魔鬼,并且把他从人们心里驱逐出去。还是睡的有点晚,一个月了都没达到自然醒
阅读全文
HBase client访问ZooKeeper获取root-region-server DeadLock问题(zookeeper.ClientCnxn Unable to get data of znode /hbase/root-region-server)
摘要:2012年11月28日 出现故障,"Unabletogetdataofznode/hbase/root-region-server"问题比较诡异,两个机房,只有一个机房故障,5台服务器相续故障,错误日志相同。使用的HBase客户端版本为0.94.01)分析步骤:1 jstack jmap 查看是否有死锁、block或内存溢出jmap看内存回收状况没有什么异常,内存和CPU占用都不多jstack pid > test.logpid: Unable to open socket file: target process not responding or HotSpot
阅读全文
浙公网安备 33010602011771号