上一页 1 2 3 4 5 6 ··· 25 下一页
摘要: 一、非并行版本分析 1.非并行版本MapReduce流程 通过第一个参数,传入Map和Reduce 函数 之后的参数为待处理文件名 读取文件 调用Map函数,对文件内容进行处理,生成KV对 对KV对进行sort 按照Key进行分组,然后对每组数据调用Reduce 将结果写入文件 二、Lab思路 概述 阅读全文
posted @ 2024-08-25 18:11 INnoVation-V2 阅读(19) 评论(0) 推荐(0) 编辑
摘要: Lab 1: MapReduce 目标:实现一个MapReduce系统。其中包含: worker进程:调用Map和Reduce程序并处理文件的读写 coordinator进程:负责将任务分发给worker并处理失败的worker。(注:本Lab使用coordinator而不是论文的master进行管 阅读全文
posted @ 2024-08-25 18:10 INnoVation-V2 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 一. 介绍 很多业务逻辑很简单,主要难点是数据量太大,可使用分布式处理提高速度。 传统分布式程序,计算逻辑和分布式任务分发、故障恢复混在一起,原本简单的计算逻辑变得模糊不清,难以处理。 MapReduce将两者分离,任务分发,容错,恢复等逻辑由模型完成,程序员只需要专注计算逻辑。大大了简化代码架构, 阅读全文
posted @ 2024-08-25 18:08 INnoVation-V2 阅读(30) 评论(0) 推荐(0) 编辑
摘要: MapReduce: Simplified Data Processing on Large Clusters(MapReduce: 简化大型集群下的数据处理) 作者:Jeffrey Dean and Sanjay Ghemawat Abstract(摘要) MapReduce是一个关于实施大型数据 阅读全文
posted @ 2024-08-25 18:08 INnoVation-V2 阅读(31) 评论(0) 推荐(0) 编辑
摘要: Kafka问题集 1.设置auto.offset.reset Kafka默认读取模式是group-offsets,即从当前group上次读的停止位置继续 但是如果该group是第一次出现,kafka中没有他的offset,就会报错,需要设置auto.offset.reset参数 在Flink中,设置 阅读全文
posted @ 2024-08-13 00:16 INnoVation-V2 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 1.安装 我们用docker进行安装 去Docker官网下载并安装Docker Desktop 去Docker Hub查看Kafka最新版本,我这里使用3.8.0,打开指令,输入以下安装指令 docker pull apache/kafka:3.8.0 下载完成后,启动kafka docker ru 阅读全文
posted @ 2024-08-13 00:16 INnoVation-V2 阅读(32) 评论(0) 推荐(0) 编辑
摘要: CH-11 FlinkSQL 11.1 快速上手 引入依赖 <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-table-api-scala-bridge_2.12</artifactId> <version>${f 阅读全文
posted @ 2024-08-08 20:14 INnoVation-V2 阅读(9) 评论(0) 推荐(0) 编辑
摘要: CH12 Flink CEP 12.1 基本概念 CEP:复杂事件处理(Complex Event Processing) 复杂事件处理就是在事件流里,检测以特定顺序先后发生的一组事件,进行统计或报警提示,比如“连续登录失败”,或者“订单支付超时”等。 总结起来,复杂事件处理的流程可以分成三个步骤: 阅读全文
posted @ 2024-08-08 20:14 INnoVation-V2 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 一个Flink程序,就是对DataStream进行各种转换。基本上由以下几部分构成 接下来分别从执行环境、数据源、转换操作、输出四大部分,介绍DataStream API。 导入Scala DataStream Api import org.apache.flink.streaming.api.sc 阅读全文
posted @ 2024-08-08 20:13 INnoVation-V2 阅读(13) 评论(0) 推荐(0) 编辑
摘要: CH-10 容错机制 Flink有一套完整的容错机制来保证故障后的恢复,其中最重要的是检查点。本章将深入了解检查点的原理和Flink的容错机制。 10.1CheckPoint 触发保存时机 周期性保存,间隔时间可以设置 val env = StreamExecutionEnvironment.get 阅读全文
posted @ 2024-08-08 20:11 INnoVation-V2 阅读(17) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 25 下一页