hive return code 2的问题
在执行脚本:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 | create table liuchengtmp1_%CHINDAASDATE% as select a.markcode, a.xiangmu, case when instrfun(xiangmu, '已注册(' ) > 0 THEN '已注册' when instrfun(xiangmu, '初步审定(' ) > 0 THEN '初步审定' ELSE XIANGMU END XIANGMU_new from f_tm_process_hdfs_ext_%CHINDAASDATE% a join ( select max(fliuc_id) fliucid1 from f_tm_process_hdfs_ext_%CHINDAASDATE% a join (select a.markcode,max(a.liuchengdate) maxliuchendate,max(a.fliuc_idt) maxfliucidt from f_tm_process_hdfs_ext_%CHINDAASDATE% a join (select markcode, max(liuchengdate) maxliuchendate from f_tm_process_hdfs_ext_%CHINDAASDATE% group by markcode) b on a.markcode = b.markcode and a.liuchengdate = b.maxliuchendate group by a.markcode) c on a.markcode = c.markcode and a.liuchengdate = c.maxliuchendate and a.fliuc_idt = c.maxfliucidt group by a.markcode; ) e on (a.fliuc_id = e.fliucid1); |
脚本分拆成12个mr任务,在执行到第5个mr任务的时候报错如下:
网上找了好多资料,有的说这不是个错,有的说是内存不够造成,看上面报错截图,内存使用一直在增加,
因此估计是内存不够了,
后来处理措施为,将上述语句拆分成2步来执行,中间有一次数据落地,这样防止将所有数据都放在内存中执行,如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 | drop table if exists liuchengtmp_%CHINDAASDATE%; create table liuchengtmp_%CHINDAASDATE% as select max(fliuc_id) fliucid1 from f_tm_process_hdfs_ext_%CHINDAASDATE% a join (select a.markcode,max(a.liuchengdate) maxliuchendate,max(a.fliuc_idt) maxfliucidt from f_tm_process_hdfs_ext_%CHINDAASDATE% a join (select markcode, max(liuchengdate) maxliuchendate from f_tm_process_hdfs_ext_%CHINDAASDATE% group by markcode) b on a.markcode = b.markcode and a.liuchengdate = b.maxliuchendate group by a.markcode) c on a.markcode = c.markcode and a.liuchengdate = c.maxliuchendate and a.fliuc_idt = c.maxfliucidt group by a.markcode; drop table if exists liuchengtmp1_%CHINDAASDATE%; create table liuchengtmp1_%CHINDAASDATE% as select a.markcode, a.xiangmu, case when instrfun(xiangmu, '已注册(' ) > 0 THEN '已注册' when instrfun(xiangmu, '初步审定(' ) > 0 THEN '初步审定' ELSE XIANGMU END XIANGMU_new from f_tm_process_hdfs_ext_%CHINDAASDATE% a join liuchengtmp_%CHINDAASDATE% b on (a.fliuc_id = b.fliucid1); |
修改后,执行,不在报错
下面是参考链接,值得看看老外们的说法:
http://stackoverflow.com/questions/11185528/what-is-hive-return-code-2-from-org-apache-hadoop-hive-ql-exec-mapredtask/11248618
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架