07 2020 档案

摘要:Amazon Athena概览 快速了解Athena 是什么?关键字: 交互式查询服务 ad-hoc查询 支持标准SQL 指定S3中的数据形成表(类似hive) 快速响应(seconds级别) serverless 支持JDBC连接和Java API连接 Amazon Athena is an in 阅读全文
posted @ 2020-07-19 14:55 sw_kong 阅读(1152) 评论(0) 推荐(0) 编辑
摘要:原文:王知无 https://www.cnblogs.com/importbigdata/p/12178404.html 维表JOIN-绕不过去的业务场景 在Flink 流处理过程中,经常需要和外部系统进行交互,用维度表补全事实表中的字段。 例如:在电商场景中,需要一个商品的skuid去关联商品的一 阅读全文
posted @ 2020-07-03 09:57 sw_kong 阅读(929) 评论(0) 推荐(0) 编辑
摘要:在实际生产中,我们经常会有这样的需求,需要以原始数据流作为基础,然后关联大量的外部表来补充一些属性。例如,我们在订单数据中,希望能得到订单收货人所在省的名称,一般来说订单中会记录一个省的 ID,那么需要根据 ID 去查询外部的维度表补充省名称属性。 在 Flink 流式计算中,我们的一些维度属性一般 阅读全文
posted @ 2020-07-02 10:12 sw_kong 阅读(9788) 评论(1) 推荐(2) 编辑