上一页 1 2 3 4 5 6 ··· 11 下一页
摘要: 概念 在Flink架构体系中,有状态计算可以说是Flink非常重要的特性之一 Flink优势: 支持高吞吐、低延迟、高性能 支持事件时间Event_time概念 支持有状态计算 有状态计算是指: 在程序计算过程中,在Flink程序内部存储计算产生的中间结果,并提供给后续Function或算子计算结果 阅读全文
posted @ 2022-05-16 13:43 chaplinthink 阅读(271) 评论(0) 推荐(0) 编辑
摘要: 基础概念 支持三种时间概念: Processing Time 时间递增 Ingestion Time : 摄入时间,数据进入Flink框架的时间,在Source Operator中设置,每个事件拿到当前时间作为时间戳,后续的时间窗口基于该时间 Event Time 支持一定程度的乱序 上一个 che 阅读全文
posted @ 2022-05-14 23:17 chaplinthink 阅读(39) 评论(0) 推荐(0) 编辑
摘要: DataStream API主要可为分为三个部分,DataSource模块、Transformation模块以及DataSink模块。 DataSource模块 内置DataSource:文件数据源 读取类型(WatchType): 其中WatchType共分为两种模式: PROCESS_CONTI 阅读全文
posted @ 2022-05-13 12:34 chaplinthink 阅读(105) 评论(0) 推荐(0) 编辑
摘要: 单表查询【使用的频率高】 1.prewhere代表where Prewhere 和 where 语句的作用相同,用来过滤数据。不同之处在于 prewhere 只支持*MergeTree 族系列引擎的表,首先会读取指定的列数据,来判断数据过滤,等待数据过滤之后再读取 select 声明的列字段来补全其 阅读全文
posted @ 2022-05-11 09:45 chaplinthink 阅读(731) 评论(0) 推荐(0) 编辑
摘要: 副本 副本的目的主要是保障数据的高可用性,即使一台 ClickHouse 节点宕机,那么也可以从其他服务器获得相同的数据 配置副本 1. zookeeper集群准备 2. Clickhouse准备两个节点 Node1, Node2 在 Node1 的/etc/clickhouse-server/co 阅读全文
posted @ 2022-05-10 13:17 chaplinthink 阅读(432) 评论(0) 推荐(0) 编辑
摘要: Insert 基本与标准 SQL(MySQL)基本一致 (1)标准 insert into [table_name] values(…),(….) (2)从表到表的插入 insert into [table_name] select a,b,c from [table_name_2] update和 阅读全文
posted @ 2022-05-09 20:07 chaplinthink 阅读(402) 评论(0) 推荐(0) 编辑
摘要: ClickHouse安装 采用doker安装测试: 拉取服务端 docker pull yandex/clickhouse-server 拉取客户端 docker pull yandex/clickhouse-client 启动ck-server: docker run -d --name ck-s 阅读全文
posted @ 2022-05-08 12:47 chaplinthink 阅读(365) 评论(0) 推荐(0) 编辑
摘要: 本篇主要讲解Flink CDC与hudi整合实践, 探索新的湖仓一体架构 阅读全文
posted @ 2022-05-05 22:00 chaplinthink 阅读(1241) 评论(0) 推荐(0) 编辑
摘要: Flink CDC同步MySQL分库分表数据到Iceberg数据湖实践 阅读全文
posted @ 2022-04-25 22:05 chaplinthink 阅读(2405) 评论(0) 推荐(0) 编辑
摘要: 主要从架构、组件原理、业务场景等角度针对相关组件的技术要点进行总结 阅读全文
posted @ 2022-04-19 21:41 chaplinthink 阅读(730) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 11 下一页