摘要: Hive是数据仓库,主要用来对历史数据做分析 Hive 的产生是为了帮助非java程序员做MR分析 Hive是以hdfs为基础的,所有的数据存储在hdfs上,hive的所有操作都是hdfs和MR操作 Hive的搭建主要是mysql服务的配置信息,hdfs存储数据的路径 Hive分区是为了提高查询的效 阅读全文
posted @ 2020-09-26 17:45 咔咔kk 阅读(571) 评论(0) 推荐(0) 编辑
摘要: 这种存储方式需要在本地运行一个mysql服务器 安装前,需先安装hadoop,jdk,和mysql。详见https://www.cnblogs.com/hzcjd/p/13669270.html 第一步:Liunx环境下安装mysql wget http://repo.mysql.com/mysql 阅读全文
posted @ 2020-09-26 17:20 咔咔kk 阅读(208) 评论(0) 推荐(0) 编辑