随笔分类 -  hive

摘要:(前人写的不错,很实用,负责任转发)转自:http://www.crazyant.net/1197.html Hive的insert语句能够从查询语句中获取数据,并同时将数据Load到目标表中。现在假定有一个已有数据的表staged_employees(雇员信息全量表),所属国家cnty和所属州st 阅读全文
posted @ 2021-07-22 11:32 muyue123 阅读(814) 评论(0) 推荐(0) 编辑
摘要:Hive 中 A 表存在数据, 但执行 select count(*) from A 返回结果为 0 原因 参数 hive.compute.query.using.stats 默认为 false, 在参数优化时修改为 true 导致上述问题产生 解决 使用 select count(*) / cou 阅读全文
posted @ 2021-02-04 11:47 muyue123 阅读(1590) 评论(0) 推荐(0) 编辑
摘要:select cast(conv('1FFC',16,10) as int) & cast(conv('1FFC',16,10) as int) 进制转换函数 : conv 语法: conv(BIGINT num, int from_base, int to_base)返回值: string说明: 阅读全文
posted @ 2020-10-09 18:36 muyue123 阅读(130) 评论(0) 推荐(0) 编辑
摘要:select regexp_replace(lg,'\\n|\\r|\\t|\\s+','') from spd_trancare_mid.mapping_lg_desc 阅读全文
posted @ 2020-09-25 16:40 muyue123 阅读(467) 评论(0) 推荐(0) 编辑
摘要:-- 数组 -- 有如下数据: 战狼2,吴京:吴刚:龙母,2017-08-16 三生三世十里桃花,刘亦菲:痒痒,2017-08-20 普罗米修斯,苍老师:小泽老师:波多老师,2017-09-17 美女与野兽,吴刚:加藤鹰,2017-09-17 -- 建表映射: create table t_movi 阅读全文
posted @ 2020-07-23 17:54 muyue123 阅读(137) 评论(0) 推荐(0) 编辑
摘要:使用动态分区表必须配置的参数 : set hive.exec.dynamic.partition =true(默认false),表示开启动态分区功能 set hive.exec.dynamic.partition.mode = nonstrict(默认strict),表示允许所有分区都是动态的,否则 阅读全文
posted @ 2020-07-13 17:02 muyue123 阅读(842) 评论(0) 推荐(0) 编辑
摘要:1:使用count(*)显示为0,但select操作时发现表有中数据。 因为执行count(1)或count(*)统计行数时,默认会从Hive的元数据库中查询 rowsNum 对应值作为结果返回(至于为什么不自动更新,尚不清楚)。 解决方案: 1——使用ANALYZE命令手动更新表统计信息:ANAL 阅读全文
posted @ 2020-06-29 17:42 muyue123 阅读(104) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示