摘要: 一. Hive基本概念 1.1 Hive是什么 Hive是基于Hadoop的一个数据仓库工具 ,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 Hive本质 : Hive其实就是将用户写的HQL,给翻译成对应的mr模板,然后执行这些mr程序,hive底层执行引擎其实就是MapReduc 阅读全文
posted @ 2020-06-23 23:08 来自遥远的水星 阅读(645) 评论(0) 推荐(0) 编辑
摘要: 0.HDFS-HA的工作机制 问题:因为hdfs的中心就是namenode,而我们的集群只有一台服务器安装了nn,如果这台服务器挂掉,整个集群瘫痪,这个就是典型的单点故障,搭建HA其实就是为了解决单点故障问题 解决办法:安装多台nn 此方案有如下问题需要解决? a)多个nn内部元数据的数据一致性的问 阅读全文
posted @ 2020-06-23 22:56 来自遥远的水星 阅读(417) 评论(0) 推荐(0) 编辑
摘要: 目的 通过Notepad++远程登录linux主机,修改配置文件 预期效果 在Notepad++上登录linux主机hadoop102,修改配置文件,保存即可 操作步骤 1.打开插件 查看是否已经安装NppFTP插件 若已安装则跳到第3步;若未安装打开插件管理安装NppFTP 2.安装NppFTP 阅读全文
posted @ 2020-06-23 19:41 来自遥远的水星 阅读(439) 评论(0) 推荐(0) 编辑