Xiaohu_BigData

2020年5月23日

摘要： Flink 框架中支持事件时间、摄入时间和处理时间三种。而当我们在流式计算环境中数据从 Source 产生，再到转换和输出，这个过程由于网络和反压的原因会导致消息乱序。因此，需要有一个机制来解决这个问题，这个特别的机制就是“水位线”。 Flink 的窗口和时间根据窗口数据划分的不同，目前 Flink 阅读全文

posted @ 2020-05-23 16:01 Xiaohu_BigData 阅读(7500) 评论(0) 推荐(0) 编辑

2020年5月20日

Flink学习（十三） Flink 常见核心概念分析

摘要：分布式缓存熟悉 Hadoop 的你应该知道，分布式缓存最初的思想诞生于 Hadoop 框架，Hadoop 会将一些数据或者文件缓存在 HDFS 上，在分布式环境中让所有的计算节点调用同一个配置文件。在 Flink 中，Flink 框架开发者们同样将这个特性进行了实现。 Flink 提供的分布式缓存类阅读全文

posted @ 2020-05-20 20:02 Xiaohu_BigData 阅读(1224) 评论(1) 推荐(1) 编辑

Flink学习（十二） Sink到JDBC(可扩展到任何关系型数据库)

摘要：导入依赖 <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>5.1.46</version> </dependency> 编译代码 package com.wyh. 阅读全文

posted @ 2020-05-20 17:24 Xiaohu_BigData 阅读(2684) 评论(0) 推荐(0) 编辑

Flink学习（十一） Sink到Elasticsearch

摘要：导入依赖 <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-connector-elasticsearch6_2.11</artifactId> <version>1.7.2</version> </dependen 阅读全文

posted @ 2020-05-20 17:21 Xiaohu_BigData 阅读(1885) 评论(1) 推荐(0) 编辑

2020年5月19日

Flink学习（十） Sink到Redis

摘要：添加依赖 <dependency> <groupId>org.apache.bahir</groupId> <artifactId>flink-connector-redis_2.11</artifactId> <version>1.0</version> </dependency> 编写代码 pa 阅读全文

posted @ 2020-05-19 23:30 Xiaohu_BigData 阅读(1998) 评论(0) 推荐(0) 编辑

Flink学习（九） Sink到Kafka

摘要： package com.wyh.streamingApi.sink import java.util.Properties import org.apache.flink.api.common.serialization.SimpleStringSchema import org.apache.fl 阅读全文

posted @ 2020-05-19 23:28 Xiaohu_BigData 阅读(1153) 评论(0) 推荐(0) 编辑

2020年5月16日

Flink学习（八） Flink SQL & Table 编程和案例

摘要： Flink Table & SQL 概述背景我们在前面的课时中讲过 Flink 的分层模型，Flink 自身提供了不同级别的抽象来支持我们开发流式或者批量处理程序，下图描述了 Flink 支持的 4 种不同级别的抽象。 Table API 和 SQL 处于最顶端，是 Flink 提供的高级 API 阅读全文

posted @ 2020-05-16 16:51 Xiaohu_BigData 阅读(4915) 评论(0) 推荐(0) 编辑

2020年5月14日

Flink学习（七）多流转换算子拆分合并流

摘要：一、Split 和 Select （使用split切分过的流是不能被二次切分的） DataStream --> SplitStream : 根据特征把一个DataSteam 拆分成两个或者多个DataStream. SplitStream --> DataStream:从一个SplitStream中阅读全文

posted @ 2020-05-14 23:58 Xiaohu_BigData 阅读(3545) 评论(0) 推荐(0) 编辑

2020年5月13日

Flink学习（六）常用DataStreaming API

摘要：曾经提到过，Flink 很重要的一个特点是“流批一体”，然而事实上 Flink 并没有完全做到所谓的“流批一体”，即编写一套代码，可以同时支持流式计算场景和批量计算的场景。目前截止 1.10 版本依然采用了 DataSet 和 DataStream 两套 API 来适配不同的应用场景。 DateSe 阅读全文

posted @ 2020-05-13 21:14 Xiaohu_BigData 阅读(1434) 评论(0) 推荐(0) 编辑

Flink学习（五） Flink 的核心语义和架构模型

摘要： Flink 的核心语义和架构模型我们在讲解 Flink 程序的编程模型之前，先来了解一下 Flink 中的 Streams、State、Time 等核心概念和基础语义，以及 Flink 提供的不同层级的 API。 Flink 核心概念Streams（流），流分为有界流和无界流。有界流指的是有固定大小阅读全文

posted @ 2020-05-13 19:23 Xiaohu_BigData 阅读(776) 评论(0) 推荐(0) 编辑

公告