上一页 1 ··· 27 28 29 30 31 32 33 34 35 ··· 45 下一页
摘要: 1、数据准备 本次练习的数据是采集电商网站的用户行为数据,主要包含用户的4种行为:搜索、点击、下单和支付 数据格式 数据采用_分割字段 每一行表示用户的一个行为,所以每一行只能是四种行为中的一种。 如果搜索关键字是null,表示这次不是搜索 如果点击的品类id和产品id是-1表示这次不是点击 下单行 阅读全文
posted @ 2022-04-13 20:31 晓枫的春天 阅读(112) 评论(0) 推荐(0) 编辑
摘要: Spark 为了达到高并发,高吞吐数据处理能力除了封装RDD外,也封装了另外两个数据对象 广播变量:分布式共享只读变量 累加器:分布式共享只写变量 1、广播变量 1.1、广播变量存在的意义 如果我们需要在分布式计算里面分发大对象,例如:集合,字典或者黑白名单等,这个都会有 Driver 端进行分发, 阅读全文
posted @ 2022-04-11 07:09 晓枫的春天 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 1、程序的流程控制说明 .在程序中,程序运行的流程控制决定程序是如何执行的,是我们必须掌握的,主要有三大流程控制语句。说明:Scala语言中控制结构和Java语言中的控制结构基本相同,在不考虑特殊应用场景的情况下,代码书写方式以及理解方式都没有太大的区别; 顺序控制 分支控制 循环控制 2、顺序控制 阅读全文
posted @ 2022-04-08 08:02 晓枫的春天 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 1、运算符简介 运算符是一种特殊的符号,用以表示数据的运算、赋值和比较等。 算术运算符 赋值运算符 比较运算符(关系运算符) 逻辑运算符 位运算符 2、算术运算符 2.1、算术运算符介绍 算术运算符(arithmetic)是对数值类型的变量进行运算的,在Scala程序中使用的非常多 2.2、算术运算 阅读全文
posted @ 2022-04-07 08:12 晓枫的春天 阅读(46) 评论(0) 推荐(0) 编辑
摘要: Kafka-Eagle框架可以监控Kafka集群的整体运行情况,在生产环境中经常使用。 1、MySQL环境准备 Kafka-Eagle的安装依赖于MySQL,MySQL主要用来存储可视化展示的数据。 链接:https://pan.baidu.com/s/1fRHTwUgJciAT8g8IZhdrFQ 阅读全文
posted @ 2022-04-06 11:38 晓枫的春天 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 1、offset位移 1.1、offset的默认维护位置 从0.9版本开始,consumer默认将offset保存在Kafka一个内置的topic中,该topic为__consumer_offsets,Kafka0.9版本之前,consumer默认将offset保存在Zookeeper中 __con 阅读全文
posted @ 2022-04-05 11:44 晓枫的春天 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 1、kafka 消费方式 pull(拉)模式:Kafka 消费方式消费速度:10m/s消费速度:20m/s消费速度:50m/s➢push(推)模式:consumer采用从broker中主动拉取数据。Kafka采用这种方式。 push(推)模式:Kafka没有采用这种方式,因为由broker决定消息发 阅读全文
posted @ 2022-04-04 20:55 晓枫的春天 阅读(338) 评论(0) 推荐(0) 编辑
摘要: 1.1、副本基本信息 Kafka副本作用:提高数据可靠性。 Kafka默认副本1个,生产环境一般配置为2个,保证数据可靠性;太多副本会增加磁盘存储空间,增加网络上数据传输,降低效率。 Kafka中副本分为:Leader和Follower。Kafka生产者只会把数据发往Leader,然后Followe 阅读全文
posted @ 2022-04-04 16:20 晓枫的春天 阅读(69) 评论(0) 推荐(0) 编辑
摘要: 什么是水位线 在事件时间语义下,我们不依赖系统时间,而是基于数据自带的时间戳去定义了一个时钟,用来表示当前时间的进展。于是每个并行子任务都会有一个自己的逻辑时钟,它的前进是靠数据的时间戳来驱动的。但在分布式系统中,这种驱动方式又会有一些问题。因为数据本身在处理转换的过程中会变化,如果遇到窗口聚合这样 阅读全文
posted @ 2022-04-02 18:14 晓枫的春天 阅读(1229) 评论(3) 推荐(1) 编辑
摘要: PrettyZoo下载安装 下载 PrettyZoo是一款基于 Apache Curator 和 JavaFX 实现的 Zookeeper 图形化管理客户端。颜值很高,使用方便,非常推荐童鞋们使用。 下载地址 https://github.com/vran-dev/PrettyZoo/release 阅读全文
posted @ 2022-04-01 06:44 晓枫的春天 阅读(947) 评论(0) 推荐(0) 编辑
上一页 1 ··· 27 28 29 30 31 32 33 34 35 ··· 45 下一页