上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 25 下一页

2020年8月26日

Spark——系统调优

摘要: JVM层 降低cache操作的内存占比 Spark中,堆内存被划分成了两块: 专门用来给RDD的cache、persist操作进行RDD数据缓存用的; 用来给spark算子函数的运行使用的,存放函数中自己创建的对象。 默认情况下,给RDD cache操作的内存占比是0.6,即60%的内存都给了cac 阅读全文

posted @ 2020-08-26 10:51 曹伟雄 阅读(530) 评论(0) 推荐(0) 编辑

Spark——Spark Streaming 对比 Structured Streaming

摘要: 简介 Spark Streaming Spark Streaming是spark最初的流处理框架,使用了微批的形式来进行流处理。 提供了基于RDDs的Dstream API,每个时间间隔内的数据为一个RDD,源源不断对RDD进行处理来实现流计算。 Structured Streaming Spark 阅读全文

posted @ 2020-08-26 10:50 曹伟雄 阅读(3329) 评论(0) 推荐(2) 编辑

Prometheus——PromQL内置函数

摘要: increase() increase(v range-vector) 函数获取区间向量中的第一个和最后一个样本并返回其增长量,它会在单调性发生变化时(如由于采样目标重启引起的计数器复位)自动中断。 由于这个值被外推到指定的整个时间范围,所以即使样本值都是整数,你仍然可能会得到一个非整数值,如果除以 阅读全文

posted @ 2020-08-26 10:49 曹伟雄 阅读(7294) 评论(0) 推荐(0) 编辑

2020年8月5日

Spark——需要HADOOP来运行SPARK吗?

摘要: 前言 Spark,是分布式计算平台,是一个用scala语言编写的计算框架,基于内存的快速、通用、可扩展的大数据分析引擎。 Hadoop,是分布式管理、存储、计算的生态系统;包括HDFS(存储)、MapReduce(计算)、Yarn(资源调度)。 Hadoop和Apache Spark都是当今蓬勃发展 阅读全文

posted @ 2020-08-05 15:37 曹伟雄 阅读(8562) 评论(0) 推荐(0) 编辑

Spark——常用命令

摘要: 查看正在处理(appStatus=SUBMITED、ACCEPTED、RUNNING)的应用 yarn application -list 查看所有的应用 yarn application -list -appStates ALL 查看某个应用的状态 yarn application -status 阅读全文

posted @ 2020-08-05 15:36 曹伟雄 阅读(1136) 评论(0) 推荐(0) 编辑

Hadoop——常用命令

摘要: 查询 hadoop dfs -ls / hadoop dfs -ls -R / 注:-R 是递归查询 创建目录 hadoop dfs -mkdir /test 创建文件 hadoop dfs -touchz /aa.txt 查看文件内容 hadoop dfs -cat /test/aa.txt 上传 阅读全文

posted @ 2020-08-05 15:35 曹伟雄 阅读(504) 评论(0) 推荐(0) 编辑

2020年7月15日

Canal——canal server 读取 binlog 到 kafka 然后在使用 canal-adapter

摘要: 前言 本篇只介绍跟 Kafka模式 相关的配置。 TCP模式 请参考文章:【Canal——增量同步MySQL数据到ElasticSearch】 高可用 请参考文章:【Canal——高可用架构设计与应用】 一、架构 二、canal-server 配置 修改canal 配置文件: vi /usr/loc 阅读全文

posted @ 2020-07-15 11:19 曹伟雄 阅读(3641) 评论(0) 推荐(0) 编辑

Canal——高可用架构设计与应用

摘要: 前言 本篇只介绍跟 高可用 相关的配置。 TCP模式 请参考文章:【Canal——增量同步MySQL数据到ElasticSearch】 Kafka模式 请参考文章:【Canal——canal server 读取 binlog 到 kafka 然后在使用 canal-adapter】 Canal se 阅读全文

posted @ 2020-07-15 11:18 曹伟雄 阅读(4941) 评论(0) 推荐(2) 编辑

2020年7月14日

JMeter——线程组&聚合报告

摘要: 一、线程组分类 线程组元件是任何一个测试计划的开始点。在一个测试计划中的所有元件都必须在某个线程下。所有的任务都是基于线程组。 上图可以看到,jmeter有三个添加线程组的选项,名字不一样, 但是创建之后,其界面是完全一样的。 1、setup thread group 一种特殊类型的ThreadGr 阅读全文

posted @ 2020-07-14 11:19 曹伟雄 阅读(1305) 评论(0) 推荐(0) 编辑

2020年6月16日

Java——代理模式:静态代理、动态代理、cglib代理

摘要: 一、代理模式介绍 代理模式是一种设计模式,提供了对目标对象额外的访问方式,即通过代理对象访问目标对象,这样可以在不修改原目标对象的前提下,提供额外的功能操作,扩展目标对象的功能。 简言之,代理模式就是设置一个中间代理来控制访问原目标对象,以达到增强原对象的功能和简化访问方式。 代理模式UML类图 举 阅读全文

posted @ 2020-06-16 15:40 曹伟雄 阅读(799) 评论(0) 推荐(0) 编辑

上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 25 下一页

导航