摘要: Sqoop (sqoop.apache.org)工具是hadoop环境下连接关系数据库,和hadoop存储系统的桥梁,支持多种关系数据源和hive,hdfs,hbase的相互导入。一般情况下,关系数据表存在于线上环境的备份环境,需要每天进行数据导入,根据每天的数据量而言,sqoop可以全表导入,对于 阅读全文
posted @ 2019-12-15 15:05 啊啊啊啊鹏 阅读(359) 评论(0) 推荐(0) 编辑
摘要: 1、概述 HBase是三维有序存储的,通过rowkey(行键),column key(column family和qualifier)和TimeStamp(时间戳)这个三个维度可以对HBase中的数据进行快速定位。 HBase中rowkey可以唯一标识一行记录,在HBase查询的时候,有以下几种方式 阅读全文
posted @ 2019-12-15 14:21 啊啊啊啊鹏 阅读(165) 评论(0) 推荐(0) 编辑
1 2