2017年11月5日

HBase的bulkLoad

摘要: HBase的BulkLoad有两种方式: thinrow的机制是flatmap把cell的信息进行flatmap;适合少于1万列的数据集;thinrow的涵义就是少行多列; bulkload的机制则是flatmap的是行,把行在拆分为cell是在map里面做的。适合多余1万列的数据集。 thinro 阅读全文

posted @ 2017-11-05 19:32 下士闻道 阅读(742) 评论(0) 推荐(0) 编辑

制作spark镜像

摘要: 构建镜像 添加jdk引用(可以使用yum进行安装); 安装SSH 碰到一个问题,执行systemctl的时候发生了异常: Failed to get D-Bus connection 解决这个问题的方式就是: docker run --privileged -ti -e "container=doc 阅读全文

posted @ 2017-11-05 16:41 下士闻道 阅读(530) 评论(0) 推荐(0) 编辑

导航