12 2022 档案

摘要:需求描述 如下为平台商品促销数据:字段为品牌,打折开始日期,打折结束日期 create table temp_date_link ( brand_id varchar(10), start_date string, end_date string ) row format delimited fie 阅读全文
posted @ 2022-12-31 07:49 晓枫的春天 阅读(180) 评论(0) 推荐(0) 编辑
摘要:问题描述 Error running ‘MallTest.testRun’: Command line is too long. Shorten command line for MallTest.testRun.错误运行的测试。命令行太长。缩短命令行。 解决方法 在项目的.idea/workspa 阅读全文
posted @ 2022-12-30 11:23 晓枫的春天 阅读(276) 评论(0) 推荐(0) 编辑
摘要:Hive支持的存储数据的格式主要有:TEXTFILE、SEQUENCEFILE、ORC、PARQUET。 1、列式存储和行式存储 如图所示左边为逻辑表,右边第一个为行式存储,第二个为列式存储。 行存储的特点:查询满足条件的一整行数据的时候,列存储则需要去每个聚集的字段找到对应的每个列的值,行存储只需 阅读全文
posted @ 2022-12-29 09:27 晓枫的春天 阅读(273) 评论(0) 推荐(0) 编辑
摘要:Hive 自带了一些函数,比如:max/min等,但是数量有限,自己可以通过自定义UDF来方便的扩展。当Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数(UDF:user-defined function)官方参考 https://cwiki.apache.org/ 阅读全文
posted @ 2022-12-27 12:34 晓枫的春天 阅读(171) 评论(0) 推荐(0) 编辑
摘要:需求说明 有以下一个表,记录了用户登录数据 desc temp_user_login; day_id string user_id int if_login int select* from temp_user_login order by user_id,day_id; 2022-03-01 1 阅读全文
posted @ 2022-12-27 12:33 晓枫的春天 阅读(64) 评论(0) 推荐(0) 编辑
摘要:1、概述 MySQL 的用户群体很大,为了能够增强数据的实时性,很多解决方案会利用 binlog 将数据写入到 ClickHouse。为了能够监听 binlog 事件,我们需要用到类似 canal 这样的第三方中间件,这无疑增加了系统的复杂度。ClickHouse 20.8.2.3版本新增加了 Ma 阅读全文
posted @ 2022-12-26 11:17 晓枫的春天 阅读(112) 评论(0) 推荐(0) 编辑
摘要:ClickHouse的物化视图是一种查询结果的持久化,它确实是给我们带来了查询效率的提升。用户查起来跟表没有区别,它就是一张表,它也像是一张时刻在预计算的表,创建的过程它是用了一个特殊引擎,加上后来 as select,就是create一个table as select的写法。“查询结果集”的范围很 阅读全文
posted @ 2022-12-21 10:18 晓枫的春天 阅读(617) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示