11 2014 档案

Hbase region 某个regionserver挂掉后的处理
摘要:ALTER TABLESPACE TB_USER_4K EXTEND(FILE '/data/vd5/TB_USER_4K.tbs' 10240)tail -f /var/cloud/logs/hbase/hbase-???-regionserver-d164.logtail -f /var/clo... 阅读全文

posted @ 2014-11-27 19:47 雨渐渐 阅读(3581) 评论(0) 推荐(0) 编辑

gentoo
摘要:http://www.aboutyun.com/thread-8522-1-1.html .java.io.IOException: Connection reset by peercat /proc/mdstatmdadm --assemble /dev/md4 /dev/sd(abcd)4htt... 阅读全文

posted @ 2014-11-21 13:56 雨渐渐 阅读(365) 评论(0) 推荐(0) 编辑

Hbase 常用shell命令
摘要:进入hbase shell console$HBASE_HOME/bin/hbase shell如果有kerberos认证,需要事先使用相应的keytab进行一下认证(使用kinit命令),认证成功之后再使用hbase shell进入可以使用whoami命令可查看当前用户hbase(main)> w... 阅读全文

posted @ 2014-11-18 12:27 雨渐渐 阅读(4415) 评论(0) 推荐(1) 编辑

网络爬虫速成指南(二)网页解析(基于算法)
摘要:此类算法用来抽取文章的正文。这里介绍两种方式:将html加载未dom树,计算文字连接比将html作为文本,计算出行块分布性能比较:1000个网页: 行块分布函数:29秒 dom数文字连接比:66秒分析:加载为dom树会很费时间。 阅读全文

posted @ 2014-11-04 12:01 雨渐渐 阅读(299) 评论(0) 推荐(0) 编辑

导航