2014年4月22日

python ^M 产生的原因 及 lxml 如何获取text的原因

摘要: 其实跟踪一下会发现,^M 是由于 /r/n 所造成的。article = dom_c.xpath('//td[@id="article_content"]//text()')content = os.linesep.join(article) 阅读全文

posted @ 2014-04-22 17:24 雨渐渐 阅读(489) 评论(0) 推荐(0) 编辑

全概率公式的几何意义

摘要: 阅读全文

posted @ 2014-04-22 16:17 雨渐渐 阅读(338) 评论(0) 推荐(0) 编辑

Hbase对hive的支持没有hdfs的好的原因 及hbase什么时候使用 及rowkey设计技巧

摘要: hive-=mareduce 的 split 在 hbase就是 region了,,,,,,,访问region必须通过hregionserver 会造成regionser负担过大,另外 region有可能很大,并发度不高。1 需要大量随即读写的时候,hbdfs不支持随即读写哦。2 大数据上高并法操作... 阅读全文

posted @ 2014-04-22 10:55 雨渐渐 阅读(317) 评论(0) 推荐(0) 编辑

hbase 架构

摘要: 由图可以client并不直接和master交互,而是与zookeeper交互,所以master挂掉,依然会对外提供读写服务, 但master挂掉后无法提供数据迁移服务。所以说 hbase无单点故障,因为master迁移功能影响不大,hregionserer挂掉,数据会被迁移。但迁移需要时间,这可能影... 阅读全文

posted @ 2014-04-22 10:46 雨渐渐 阅读(173) 评论(0) 推荐(0) 编辑

导航