摘要: Samza的task可以把数据进行本地存储,并且对这些数据进行丰富的查询。比较SQL中的select ... where...并不需要保存状态。但是aggregation和join就需要存储row之间的状态。Samza提供了一些基本功能,能够使得streaming join和aggregation以... 阅读全文
posted @ 2014-04-26 18:04 devos 阅读(426) 评论(0) 推荐(0) 编辑
摘要: 当Samza ApplicationMaster启动时,它做以下的事情:通过STREAMING_CONFIG环境变量从YARN获取配置信息(configuration)在随机端口上 启动一个JMX server实例化一个metrics registry和reporter来追踪计量信息将AM向YARN... 阅读全文
posted @ 2014-04-26 18:01 devos 阅读(696) 评论(0) 推荐(0) 编辑