上一页 1 ··· 7 8 9 10 11 12 13 14 15 下一页
摘要: 1. 一致性模型 弱一致性 最终一致性 DNS (Domain Name System) Gossip (Cassandra的通信协议) 强一致性 同步 Paxos Raft (multi paxos) ZAB (multi paxos) 2. 强一致性要解决的的问题 数据不能存在单点上(安全) 分 阅读全文
posted @ 2019-11-04 23:02 wellDoneGaben 阅读(671) 评论(0) 推荐(0) 编辑
摘要: 1. 前置条件: 之前已经搭好了带有HDFS, MapReduce,Yarn 的 Hadoop 集群 链接: ubuntu18.04.2 hadoop3.1.2+zookeeper3.5.5高可用完全分布式集群搭建 2. 上传tar包并修改配置文件 解压tar包到指定目录 进入配置目录 vim hb 阅读全文
posted @ 2019-11-03 16:08 wellDoneGaben 阅读(360) 评论(0) 推荐(0) 编辑
摘要: 1. 集群规划 | | Master JobManager | Standby JobManager | Task Manager | Zookeeper | | | | | | | | flink01 | √ | | | √ | | flink02 | | √ | | √ | | flink03 阅读全文
posted @ 2019-11-03 10:30 wellDoneGaben 阅读(453) 评论(0) 推荐(0) 编辑
摘要: 设置 Run = Edit Configurations = VM options 添加 XX:+PrintGCDetails 运行程序后会在末尾打印GC信息 PSYoungGen(Parallel Scavenge): Eden + FromSpace 完整的YoungGeneration: Ed 阅读全文
posted @ 2019-11-02 13:32 wellDoneGaben 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 一.goroutine简介 Golang中最迷人的一个优点就是从语言层面就支持并发 在Golang中的goroutine(协程)类似于其他语言的线程 并发和并行 并行(parallelism)指不同的代码片段同时在不同的物理处理器上支持 并发(concurrency)指同时管理多个事情,物理处理器上 阅读全文
posted @ 2019-11-01 23:06 wellDoneGaben 阅读(224) 评论(0) 推荐(0) 编辑
摘要: 整理一下一些计算机的基础概念。 概念 MESI(Modified, Exclusive, Shared, Invalid) 也称 Illinois 协议, 由美帝UIUC(University of Illinois at Urbana Champaign, 本人表弟目前就读的学校, 计算机系美帝5 阅读全文
posted @ 2019-10-31 21:17 wellDoneGaben 阅读(440) 评论(0) 推荐(0) 编辑
摘要: Spark算子总结 算子分类 Transformation(转换) | 转换算子 | 含义 | | | | | map(func) | 返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成 | | filter(func) | 过滤, 返回一个新的RDD, 该RDD由经过func函 阅读全文
posted @ 2019-10-30 22:45 wellDoneGaben 阅读(462) 评论(0) 推荐(0) 编辑
摘要: 1. 简介 SparkStreaming是流式处理框架,是Spark API的扩展,支持可扩展、高吞吐量、容错的准实时数据流处理。 实时数据的来源可以是:Kafka, Flume, Twitter, ZeroMQ或者TCP sockets,并且可以使用高级功能的复杂算子来处理流数据。 例如:map, 阅读全文
posted @ 2019-10-29 15:44 wellDoneGaben 阅读(207) 评论(0) 推荐(0) 编辑
摘要: Spark SQL 1. 简介 SparkSQL 的前身是 Shark, SparkSQL 产生的根本原因是其完全脱离了 Hive 的限制。(Shark 底层依赖于 Hive 的解析器, 查询优化器) SparkSQL 支持查询原生的 RDD。 能够在 scala/java 中写 SQL 语句。 支 阅读全文
posted @ 2019-10-28 21:13 wellDoneGaben 阅读(547) 评论(0) 推荐(0) 编辑
摘要: Spark 内存管理 Spark 执行应用程序时, 会启动 Driver 和 Executor 两种 JVM 进程 Driver 负责创建 SparkContext 上下文, 提交任务, task的分发等。 Executor 负责 task 的计算任务, 并将结果返回给 Driver, 同时需要为需 阅读全文
posted @ 2019-10-26 14:02 wellDoneGaben 阅读(291) 评论(0) 推荐(0) 编辑
上一页 1 ··· 7 8 9 10 11 12 13 14 15 下一页