随笔分类 -  storm

摘要:摘要:Storm的编程模型是一个有向无环图,决定了storm的spout接收到外部系统的请求后,spout并不能得到bolt的处理结果并将结果返回给外部请求。所以也就决定了storm无法提供对外部系统的同步调用功能。 最近新的黑名单项目需要在storm实时计算平台上提供对外部系统请求调用的同步响应( 阅读全文
posted @ 2017-09-28 09:36 暴躁IT老绵羊 阅读(7893) 评论(1) 推荐(6) 编辑
摘要:序:StreamId是storm中实现DAG有向无环图的重要一个特性,但是从实际生产环境来看,这个功能其实蛮影响生产环境的稳定性的,我们系统在迭代时会带来整体服务的不可用。 StreamId是storm中实现DAG有向无环图的重要一个特性,官方也提供对应的接口实现让开发者自己灵活化构造自己的ADG图 阅读全文
posted @ 2017-08-04 09:59 暴躁IT老绵羊 阅读(4143) 评论(0) 推荐(1) 编辑
摘要:背景:目前就职于国内最大的IT咨询公司,恰巧又是毕业季,所在部门招了20多个应届毕业生,本人要跟部门新人进行为期一个月的大数据入职培训,特此将整理的文档分享出来。 原文和作者一起讨论:http://www.cnblogs.com/intsmaze/p/7274361.html 微信:intsmaze 阅读全文
posted @ 2017-08-02 16:03 暴躁IT老绵羊 阅读(5328) 评论(1) 推荐(4) 编辑
摘要:Storm 中的 tuple可以包含任何类型的对象。由于Storm 是一个分布式系统,所以在不同的任务之间传递消息时Storm必须知道怎样序列化、反序列化消息对象。 Storm 使用 Kryo库对对象进行序列化。Kryo 是一个灵活、快速的序列化库。Storm 默认支持基础类型、string、byt 阅读全文
posted @ 2017-06-24 21:38 暴躁IT老绵羊 阅读(8725) 评论(1) 推荐(1) 编辑
摘要:Hbas预分区 在系统中向hbase中插入数据时,常常通过设置region的预分区来防止大数据量插入的热点问题,提高数据插入的效率,同时可以减少当数据猛增时由于Region split带来的资源消耗。大量的预分区数量会导致hbase客户端缓存大量的分区地址,导致内存的增长,某些系统中一个JVM进程中 阅读全文
posted @ 2017-03-31 08:43 暴躁IT老绵羊 阅读(11834) 评论(0) 推荐(5) 编辑
摘要:序:最近对storm平台系统进行性能检测发现偶尔会出现oncebolt向另一个twobolt发送数据后,twobolt要500毫秒后才接收到进行处理。这里简单说增大twobolt的并行度即可解决,但是究其内部原因是因为storm的通信机制所导致的问题。 先介绍背景:一个拓扑的结构,spout(并行度 阅读全文
posted @ 2017-03-14 09:15 暴躁IT老绵羊 阅读(6023) 评论(0) 推荐(0) 编辑
摘要:滑动窗口在监控和统计应用的场景比较广泛,比如每隔一段时间(10s)统计最近30s的请求量或者异常次数,根据请求或者异常次数采取相应措施。在storm1.0版本之前,没有提供关于滑动窗口的实现,需要开发者自己实现滑动窗口的功能(storm1.0以前实现滑动窗口的实现原理可以自行百度)。 原文和作者一起 阅读全文
posted @ 2017-03-01 09:11 暴躁IT老绵羊 阅读(5861) 评论(1) 推荐(0) 编辑
摘要:概要:在使用storm分布式计算框架进行数据处理时,如何保证进入storm的消息的一定会被处理,且不会被重复处理。这个时候仅仅开启storm的ack机制并不能解决上述问题。那么该如何设计出一个好的方案来解决上述问题? 现有架构背景:本人所在项目组的实时系统负责为XXX的实时产生的交易记录进行处理,根 阅读全文
posted @ 2016-12-26 07:45 暴躁IT老绵羊 阅读(2591) 评论(2) 推荐(0) 编辑
摘要:序:在开发storm项目时,提交项目jar包当把依赖的第三方jar包都打进去提交storm集群启动时报了发现多个同名的文件错误由此开始了一段对jar包的深刻理解之路。 java.lang.RuntimeException: Found multiple defaults.yaml resources 阅读全文
posted @ 2016-10-25 22:56 暴躁IT老绵羊 阅读(4541) 评论(0) 推荐(1) 编辑
摘要:安装前的准备工作 关闭防火墙 chkconfig iptables off && setenforce 0 创建用户 groupadd realtime && useradd realtime && usermod -a -G realtime realtime 创建工作目录并赋权 mkdir /e 阅读全文
posted @ 2016-10-23 00:18 暴躁IT老绵羊 阅读(563) 评论(0) 推荐(1) 编辑
摘要:正在学习storm的大兄弟们,我又来传道授业解惑了,是不是觉得自己会用ack了。好吧,那就让我开始啪啪打你们脸吧。 先说一下ACK机制: 为了保证数据能正确的被处理, 对于spout产生的每一个tuple, storm都会进行跟踪。 这里面涉及到ack/fail的处理,如果一个tuple处理成功是指 阅读全文
posted @ 2016-09-28 22:22 暴躁IT老绵羊 阅读(23303) 评论(4) 推荐(8) 编辑

点击右上角即可分享
微信分享提示