摘要: hive.exec.mode.local.auto 决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行) true hive.exec.mode.local.auto.inputbytes.max 如果 hive.exec.mode.local.auto 为 true, 阅读全文
posted @ 2019-04-22 20:13 兴风作浪 阅读(3562) 评论(0) 推荐(0) 编辑
摘要: #### 题目要求计算文档a.txt中每一行中出现的数字个数并且要计算一下整个文档中一共出现了几个数字。例如a.txt内容如下:12aa*lkjskdjalskdflkskdjflkjj我们脚本名字为 ncount.sh, 运行它时:bash ncount.sh a.txt输出结果应该为:20sum 阅读全文
posted @ 2019-04-22 20:12 兴风作浪 阅读(20400) 评论(0) 推荐(0) 编辑
摘要: 在有些时候,想要控制hql执行的mapper,reducer个数,reducer设置过少,会导致每个reducer要处理的数据过多,这样可能会导致OOM异常,如果reducer设置过多,则会导致产生很多小文件,这样对任务的执行以及集群都不太好.通常情况下这两个参数都不需要手动设置,Hive会根据文件 阅读全文
posted @ 2019-04-22 20:09 兴风作浪 阅读(3176) 评论(0) 推荐(0) 编辑
摘要: linux中wc命令用法 Linux系统中的wc(Word Count)命令的功能为统计指定文件中的字节数、字数、行数,并将统计结果显示输出。 1.命令格式: wc [选项]文件... 2.命令功能: 统计指定文件中的字节数、字数、行数,并将统计结果显示输出。该命令统计指定文件中的字节数、字数、行数 阅读全文
posted @ 2019-04-22 20:08 兴风作浪 阅读(7112) 评论(0) 推荐(0) 编辑