上一页 1 ··· 296 297 298 299 300 301 302 303 304 ··· 376 下一页
该文被密码保护。 阅读全文
posted @ 2020-10-04 15:54 秋华 阅读(664) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2020-10-04 15:44 秋华 阅读(1177) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2020-10-04 15:37 秋华 阅读(1743) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2020-10-04 15:14 秋华 阅读(1821) 评论(0) 推荐(0) 编辑
摘要: Apache Hive 已经成为了数据仓库生态系统中的核心。 它不仅仅是一个用于大数据分析和ETL场景的SQL引擎,同样它也是一个数据管理平台,可用于发现,定义,和演化数据。 Flink 与 Hive 的集成包含两个层面。 一是利用了 Hive 的 MetaStore 作为持久化的 Catalog, 阅读全文
posted @ 2020-10-03 18:03 秋华 阅读(1559) 评论(2) 推荐(0) 编辑
摘要: Flink Table 和 SQL内置了很多SQL中支持的函数;如果有无法满足的需要,则可以实现用户自定义的函数(UDF)来解决。 1 系统内置函数 Flink Table API 和 SQL为用户提供了一组用于数据转换的内置函数。SQL中支持的很多函数,Table API和SQL都已经做了实现,其 阅读全文
posted @ 2020-10-03 17:58 秋华 阅读(3188) 评论(0) 推荐(0) 编辑
摘要: 1 常规窗口 时间语义,要配合窗口操作才能发挥作用。最主要的用途,当然就是开窗口、根据时间段做计算了。下面我们就来看看Table API和SQL中,怎么利用时间字段做窗口操作。 在Table API和SQL中,主要有两种窗口:Group Windows和Over Windows 1.1 分组窗口 分 阅读全文
posted @ 2020-10-03 17:53 秋华 阅读(3432) 评论(0) 推荐(2) 编辑
摘要: Table API和SQL,本质上还是基于关系型表的操作方式;而关系型表、关系代数,以及SQL本身,一般是有界的,更适合批处理的场景。这就导致在进行流处理的过程中,理解会稍微复杂一些,需要引入一些特殊概念。 1 流处理和关系代数(表,及SQL)的区别 关系代数(表)/SQL流处理 处理的数据对象 字 阅读全文
posted @ 2020-10-03 17:49 秋华 阅读(858) 评论(0) 推荐(0) 编辑
摘要: 1 基本程序结构 Table API 和 SQL 的程序结构,与流式处理的程序结构类似;也可以近似地认为有这么几步:首先创建执行环境,然后定义source、transform和sink。 具体操作流程如下: val tableEnv = ... // 创建表环境 // 创建表 tableEnv.co 阅读全文
posted @ 2020-10-03 17:44 秋华 阅读(2430) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2020-10-02 08:58 秋华 阅读(422) 评论(0) 推荐(0) 编辑
上一页 1 ··· 296 297 298 299 300 301 302 303 304 ··· 376 下一页