摘要: Hive是一个基于HDFS的数据仓库软件,可理解为数据库管理工具;Hive的功能主要有: 1. 支持使用SQL对分布式存储的大型数据集进行读、写、管理,将SQL转化成MapReduce任务执行; 2. 将数据结构映射到已存储的数据中,即将存储在HDFS上结构化的文件内容定义成Hive的外部表。 3. 阅读全文
posted @ 2019-04-28 00:54 北辰Root 阅读(834) 评论(0) 推荐(0) 编辑
摘要: 本文主要围绕以下三方面来讨论HBase:是什么、为什么、怎样做。 1. 什么是HBase HBase是一个开源的、分布式的、非关系型数据库,其设计思想来源于Google的Big Table。通过集群管理大表(十亿行百万列),提供随机、实时的读写能力。 两个问题需要解释: 1.1 什么是非关系型数据库 阅读全文
posted @ 2019-04-28 00:46 北辰Root 阅读(1797) 评论(0) 推荐(0) 编辑