摘要: 配置参数: 1、dfs.nameservices 说明:为namenode集群定义一个services name 默认值:null 比如设置为:ns1 2、dfs.ha.namenodes.<dfs.nameservices> 说明:nameservice 包含哪些namenode,为各个namen 阅读全文
posted @ 2019-06-19 19:16 北漂-boy 阅读(17759) 评论(0) 推荐(0) 编辑
摘要: 本地模式 环境介绍 一共三台测试机 master 192.168.4.91 slave1 192.168.4.45 slave2 192.168.4.96 操作系统配置 1、Centos7操作系统 2、防火墙,selinux都关闭(在学习的时候,基本都是关闭防火墙,生产环境,防火墙都是打开的,不仅有 阅读全文
posted @ 2019-06-19 17:29 北漂-boy 阅读(914) 评论(0) 推荐(0) 编辑
摘要: Hadoop简介 Hadoop软件库是一个开源框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台计算机,每台计算机都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用程序层的故障,从而在计算机集群之上提供高可用性服务,每个计算机 阅读全文
posted @ 2019-06-19 15:06 北漂-boy 阅读(585) 评论(0) 推荐(0) 编辑
摘要: 根据。方案最右侧一栏是一个8G VM的分配方案,方案预留1-2G的内存给操作系统,分配4G给Yarn/MapReduce,当然也包括了HIVE,剩余的2-3G是在需要使用HBase时预留给HBase的。 内存调优 阅读全文
posted @ 2019-06-19 14:42 北漂-boy 阅读(13330) 评论(4) 推荐(1) 编辑
摘要: <! done hive 调优(二)参数调优汇总 在hive调优(一) 中说了一些常见的调优,但是觉得参数涉及不多,补充如下 1.设置合理solt数 mapred.tasktracker.map.tasks.maximum 每个tasktracker可同时运行的最大map task数,默认值2。 m 阅读全文
posted @ 2019-06-19 12:36 北漂-boy 阅读(1796) 评论(0) 推荐(0) 编辑
摘要: hive 调优(一)coding调优 本人认为hive是很好的工具,目前支持mr,tez,spark执行引擎,有些大公司原来封装的sparksql,开发py脚本,但是目前hive支持spark引擎(不是很稳定,建议Tez先),所以离线还是用hive比较好。 先将工作中总结,以及学习其他人的hive优 阅读全文
posted @ 2019-06-19 11:48 北漂-boy 阅读(295) 评论(0) 推荐(0) 编辑
摘要: 1、执行过程失败,报 Container killed on request. Exit code is 143 如下图: 分析:造成这种原因是由于总内存不多,而容器在jvm中占比过高,修改tez-site.xml文件,添加如下配置: 2、ERROR [main] exec.TaskRunner: 阅读全文
posted @ 2019-06-19 10:32 北漂-boy 阅读(7918) 评论(1) 推荐(1) 编辑