上一页 1 ··· 24 25 26 27 28 29 30 31 32 ··· 53 下一页

kafka监控系统

摘要: Metrics-Java版的指标度量工具之一 Metrics-Java版的指标度量工具之二 JAVA Metrics 度量工具使用介绍1 JAVA Metrics度量工具 - Metrics Core 翻译 http://blog.synyx.de/2013/09/yammer-metrics-made-easy-part-i/ http://kafka.apache.org/... 阅读全文
posted @ 2014-06-30 16:39 fxjwind 阅读(7901) 评论(0) 推荐(1) 编辑

Kafka可靠性的思考

摘要: 首先kafka的throughput 很牛逼,参考:http://engineering.linkedin.com/kafka/benchmarking-apache-kafka-2-million-writes-second-three-cheap-machines 接着主要谈一下,Kafka的可靠性问题,有哪些机会可能丢数据? 从producer,broker,consumer的... 阅读全文
posted @ 2014-06-26 19:48 fxjwind 阅读(4131) 评论(7) 推荐(1) 编辑

Andrew Ng机器学习公开课笔记 -- Regularization and Model Selection

摘要: 网易公开课,第10,11课 notes,http://cs229.stanford.edu/notes/cs229-notes5.pdf Model Selection 首先需要解决的问题是,模型选择问题,如何来平衡bais和variance来自动选择模型?比如对于多项式分类,如何决定阶数k,对于locally weighted regression如何决定窗口大小,对于SVM如何... 阅读全文
posted @ 2014-06-25 20:21 fxjwind 阅读(1332) 评论(0) 推荐(0) 编辑

storm-kafka-0.8-plus 源码解析

摘要: https://github.com/wurstmeister/storm-kafka-0.8-plus http://blog.csdn.net/xeseo/article/details/18615761 准备,一些相关类 GlobalPartitionInformation (storm.kafka.trident) 记录partitionid和broker的关系 Gl... 阅读全文
posted @ 2014-06-25 16:35 fxjwind 阅读(3982) 评论(0) 推荐(0) 编辑

Storm ack和fail机制再论

摘要: 之前对这个的理解有些问题,今天用到有仔细梳理了一遍,记录一下 首先开启storm tracker机制的前提是, 1. 在spout emit tuple的时候,要加上第3个参数messageid 2. 在配置中acker数目至少为1 3. 在bolt emit的时候,要加上第二个参数anchor tuple,以保持tracker链路 流程, 1. 当tuple具有... 阅读全文
posted @ 2014-06-24 16:47 fxjwind 阅读(2954) 评论(2) 推荐(0) 编辑

Kafka Producer接口

摘要: 参考, https://cwiki.apache.org/confluence/display/KAFKA/0.8.0+Producer+Example http://kafka.apache.org/08/configuration.html , 0.8版本,关于producer,consumer,broker所有的配置 因为Producer相对于consumer比较简单,直接看代码... 阅读全文
posted @ 2014-06-23 13:52 fxjwind 阅读(6397) 评论(8) 推荐(0) 编辑

Kafka Tools

摘要: 参考, https://cwiki.apache.org/confluence/display/KAFKA/System+Tools https://cwiki.apache.org/confluence/display/KAFKA/Replication+tools http://kafka.ap 阅读全文
posted @ 2014-06-18 13:59 fxjwind 阅读(11042) 评论(2) 推荐(0) 编辑

Kafka Consumer接口

摘要: 对于kafka的consumer接口,提供两种版本, high-level 一种high-level版本,比较简单不用关心offset, 会自动的读zookeeper中该Consumer group的last offset 参考,https://cwiki.apache.org/confluence/display/KAFKA/Consumer+Group+Example 不过要... 阅读全文
posted @ 2014-06-18 11:26 fxjwind 阅读(40113) 评论(1) 推荐(3) 编辑

Andrew Ng机器学习公开课笔记 -- 学习理论

摘要: 网易公开课,第9,10课 notes,http://cs229.stanford.edu/notes/cs229-notes4.pdf 这章要讨论的问题是,如何去评价和选择学习算法 Bias/variance tradeoff 还是用这组图,学习算法追求的是generalization error(对未知数据的预测误差),而不是training error(只是对训练集) ... 阅读全文
posted @ 2014-06-06 14:08 fxjwind 阅读(2517) 评论(0) 推荐(2) 编辑

HyperLogLog in Practice: Algorithmic Engineering of a State of The Art Cardinality Estimation Algorithm

摘要: HyperLogLog参考下面这篇blog, http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-iv.html 为何LLC在基数不大的时候会误差比较大? 直观上,由于基数不大时,会有很多空桶,而最终结果是求平均值,这个值对离群值(这里的0)非常敏感 那么重理论上看,为何误差比较... 阅读全文
posted @ 2014-05-27 16:01 fxjwind 阅读(1328) 评论(0) 推荐(0) 编辑
上一页 1 ··· 24 25 26 27 28 29 30 31 32 ··· 53 下一页