2019 年 6月 19 日随笔档案 - 北漂-boy

2019年6月19日

摘要：配置参数： 1、dfs.nameservices 说明：为namenode集群定义一个services name 默认值：null 比如设置为：ns1 2、dfs.ha.namenodes.<dfs.nameservices> 说明：nameservice 包含哪些namenode，为各个namen 阅读全文

posted @ 2019-06-19 19:16 北漂-boy 阅读(17759) 评论(0) 推荐(0) 编辑

Hadoop 安装(本地、伪分布、分布式模式)

摘要：本地模式环境介绍一共三台测试机 master 192.168.4.91 slave1 192.168.4.45 slave2 192.168.4.96 操作系统配置 1、Centos7操作系统 2、防火墙，selinux都关闭（在学习的时候，基本都是关闭防火墙，生产环境，防火墙都是打开的，不仅有阅读全文

posted @ 2019-06-19 17:29 北漂-boy 阅读(914) 评论(0) 推荐(0) 编辑

Hadoop hadoop的介绍和几种模式

摘要： Hadoop简介 Hadoop软件库是一个开源框架，允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台计算机，每台计算机都提供本地计算和存储。库本身不是依靠硬件来提供高可用性，而是设计用于检测和处理应用程序层的故障，从而在计算机集群之上提供高可用性服务，每个计算机阅读全文

posted @ 2019-06-19 15:06 北漂-boy 阅读(585) 评论(0) 推荐(0) 编辑

hive tez调优（3）

摘要：根据。方案最右侧一栏是一个8G VM的分配方案，方案预留1-2G的内存给操作系统，分配4G给Yarn/MapReduce，当然也包括了HIVE，剩余的2-3G是在需要使用HBase时预留给HBase的。内存调优阅读全文

posted @ 2019-06-19 14:42 北漂-boy 阅读(13330) 评论(4) 推荐(1) 编辑

(转) hive调优（2）

摘要： <! done hive 调优（二）参数调优汇总在hive调优（一）中说了一些常见的调优，但是觉得参数涉及不多，补充如下 1.设置合理solt数 mapred.tasktracker.map.tasks.maximum 每个tasktracker可同时运行的最大map task数，默认值2。 m 阅读全文

posted @ 2019-06-19 12:36 北漂-boy 阅读(1796) 评论(0) 推荐(0) 编辑

（转）hive调优(1) coding调优

摘要： hive 调优（一）coding调优本人认为hive是很好的工具，目前支持mr，tez，spark执行引擎，有些大公司原来封装的sparksql，开发py脚本，但是目前hive支持spark引擎（不是很稳定，建议Tez先），所以离线还是用hive比较好。先将工作中总结，以及学习其他人的hive优阅读全文

posted @ 2019-06-19 11:48 北漂-boy 阅读(295) 评论(0) 推荐(0) 编辑

hive on tez 错误记录

摘要： 1、执行过程失败，报 Container killed on request. Exit code is 143 如下图：分析：造成这种原因是由于总内存不多，而容器在jvm中占比过高，修改tez-site.xml文件，添加如下配置： 2、ERROR [main] exec.TaskRunner: 阅读全文

posted @ 2019-06-19 10:32 北漂-boy 阅读(7918) 评论(1) 推荐(1) 编辑

北漂-boy

人生就是一场自己与自己决斗的战场！

公告