摘要: 一.Hive三种设计模式 1.默认配置【使用Netty存储元数据】 2.mysql【使用mysql存储元数据】 3.配置Thrift【使用mysql存储元数据】 二.执行步骤 三.scala访问Hive 阅读全文
posted @ 2019-06-18 16:11 云山之巅 阅读(234) 评论(0) 推荐(0) 编辑
摘要: 一.表设计 1.预分区【Pre-Creating Regions】 默认情况下,在创建HBase表的时候会自动创建一个region分区,当写入数据时,所有的HBase客户端都向这一个region写数据,直到这个region足够大时才进行切分。因此,为了提高批量写入的效率可以预先创建好多个分区【这个要 阅读全文
posted @ 2019-06-18 10:51 云山之巅 阅读(208) 评论(0) 推荐(0) 编辑