boiledwater - 博客园

2018年12月6日

摘要：最近用户提交了一个问题说他的jar包里明明包含相关的类型但是在提交Flink作业的时候却报出classnotfound的错误查看之后发现这里是flink的一个没有说的太明白的地方用户的代码之所以报错是因为在代码中引用了mapreduce相关的东西我们知道 flink会在生成jobG 阅读全文

posted @ 2018-12-06 12:34 boiledwater 阅读(594) 评论(0) 推荐(0) 编辑

2018年11月14日

在es中用scroll查询与completableFuture

摘要：一般而言，es返回数据的上限是10000条，如果超过这个数量，就必须使用scroll查询。所谓scroll查询就类似DBMS中的游标，或者快照吧，利用查询条件，在第一次查询时，在所有的结果上形成了一个快照，然后再分批分次的读取出来。要完成一个scroll查询分两个阶段：阶段一：带查询参数 1 阅读全文

posted @ 2018-11-14 19:37 boiledwater 阅读(1105) 评论(0) 推荐(0) 编辑

2018年11月13日

Flink on yarn的问题：Invalid AMRMToken

摘要：目前采用的Flink的版本是1.4.2，运行在yarn上，总是时不时的报错“Invalid AMRMToken from appattempt”，导致AM挂掉。简而言之，就是AM和RM沟通的过程中，突然AM提供的Token不被认可，导致拒绝连接，进而AM挂掉。后来发现早期版本的yarn-clie 阅读全文

posted @ 2018-11-13 16:44 boiledwater 阅读(2674) 评论(0) 推荐(0) 编辑

2018年11月12日

LevelDB速记

摘要： LevelDb的基本结构如下：由六大部分组成：一、MemTable，用户写入和读取的直接对象，二、Immutable MemTable，用户状态写入的对象写满的MemTable之后会转为ImmutableMemTable，之后会写sst文件，三、LOG文件，是WAL机制的部分，用户在写入Me 阅读全文

posted @ 2018-11-12 21:41 boiledwater 阅读(394) 评论(0) 推荐(0) 编辑

2018年10月17日

akka与slf4j导致jvm直接crash的诡异

摘要：流程很简单，创建actorSystem，通过actorSystem获取AkkaQueryServiceRetriever，进而通过传递path获得的Gateway进行通信。之前在主项目里跑的很稳定，拆出来之后在本地也没有问题。单独上线之后，问题来了，整个jvm会直接crash，并且没有报错信息，阅读全文

posted @ 2018-10-17 16:01 boiledwater 阅读(376) 评论(0) 推荐(0) 编辑

2018年10月11日

一个flink作业的调优

摘要：最近接手了一个flink作业，另外一个同事断断续续有的没的写了半年的，不着急，也一直没上线，最近突然要上线，扔给我，要调通上线。现状是： 1.代码跑不动，资源给的不少，但是就是频繁反压。 2.checkpoint经常失败。 3.也是最严重的，跑着跑着，作业就挂了。接手之后，秉承着代码的业务逻辑是阅读全文

posted @ 2018-10-11 18:37 boiledwater 阅读(7667) 评论(1) 推荐(1) 编辑

2018年9月14日

Flink State的两张图

摘要： streamTask的invoke方法中，会循环去调用task上的每个operator的initializeState方法，在这个方法中，会真正创建除了savepointStream的其他三个对象，而savepointStream会lazy到做savepoint的时候才创建对象，这个也可以理解，毕阅读全文

posted @ 2018-09-14 21:15 boiledwater 阅读(1412) 评论(1) 推荐(0) 编辑

2018年8月24日

Flink源码解读之状态管理

摘要：一、从何说起 State要能发挥作用，就需要持久化到可靠存储中，flink中持久化的动作就是checkpointing，那么从TM中执行的Task的基类StreamTask的checkpoint逻辑说起。 1.streamTask 2.checkpointingOperation 这个类中，直接对s 阅读全文

posted @ 2018-08-24 21:29 boiledwater 阅读(3310) 评论(1) 推荐(0) 编辑

2018年8月16日

grpc deadlines

摘要：最近在将应用的rpc更换为grpc，使用过程中，发现报“rpc error:code=DeadlineExceeded desc = context deadline exceeded”，这是啥？原来是某位仁兄设置了环境的超时时间，但是设置了1S，看好了，是1S。所以，任何稍微费时的交互，都直接报错阅读全文

posted @ 2018-08-16 15:26 boiledwater 阅读(16849) 评论(0) 推荐(1) 编辑

2018年8月14日

基于log4j的消息流的实现之二消息传递

摘要：在“基于log4j的消息流的实现之一消息获取”中获取日志消息的部分，修改如下： import org.apache.commons.collections.map.HashedMap; import org.apache.log4j.AppenderSkeleton; import org.apac 阅读全文

posted @ 2018-08-14 20:46 boiledwater 阅读(367) 评论(0) 推荐(0) 编辑

公告