会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
fxjwind
上一页
1
···
24
25
26
27
28
29
30
31
32
···
53
下一页
kafka监控系统
摘要: Metrics-Java版的指标度量工具之一 Metrics-Java版的指标度量工具之二 JAVA Metrics 度量工具使用介绍1 JAVA Metrics度量工具 - Metrics Core 翻译 http://blog.synyx.de/2013/09/yammer-metrics-made-easy-part-i/ http://kafka.apache.org/...
阅读全文
posted @ 2014-06-30 16:39 fxjwind
阅读(7901)
评论(0)
推荐(1)
编辑
Kafka可靠性的思考
摘要: 首先kafka的throughput 很牛逼,参考:http://engineering.linkedin.com/kafka/benchmarking-apache-kafka-2-million-writes-second-three-cheap-machines 接着主要谈一下,Kafka的可靠性问题,有哪些机会可能丢数据? 从producer,broker,consumer的...
阅读全文
posted @ 2014-06-26 19:48 fxjwind
阅读(4131)
评论(7)
推荐(1)
编辑
Andrew Ng机器学习公开课笔记 -- Regularization and Model Selection
摘要: 网易公开课,第10,11课 notes,http://cs229.stanford.edu/notes/cs229-notes5.pdf Model Selection 首先需要解决的问题是,模型选择问题,如何来平衡bais和variance来自动选择模型?比如对于多项式分类,如何决定阶数k,对于locally weighted regression如何决定窗口大小,对于SVM如何...
阅读全文
posted @ 2014-06-25 20:21 fxjwind
阅读(1332)
评论(0)
推荐(0)
编辑
storm-kafka-0.8-plus 源码解析
摘要: https://github.com/wurstmeister/storm-kafka-0.8-plus http://blog.csdn.net/xeseo/article/details/18615761 准备,一些相关类 GlobalPartitionInformation (storm.kafka.trident) 记录partitionid和broker的关系 Gl...
阅读全文
posted @ 2014-06-25 16:35 fxjwind
阅读(3982)
评论(0)
推荐(0)
编辑
Storm ack和fail机制再论
摘要: 之前对这个的理解有些问题,今天用到有仔细梳理了一遍,记录一下 首先开启storm tracker机制的前提是, 1. 在spout emit tuple的时候,要加上第3个参数messageid 2. 在配置中acker数目至少为1 3. 在bolt emit的时候,要加上第二个参数anchor tuple,以保持tracker链路 流程, 1. 当tuple具有...
阅读全文
posted @ 2014-06-24 16:47 fxjwind
阅读(2954)
评论(2)
推荐(0)
编辑
Kafka Producer接口
摘要: 参考, https://cwiki.apache.org/confluence/display/KAFKA/0.8.0+Producer+Example http://kafka.apache.org/08/configuration.html , 0.8版本,关于producer,consumer,broker所有的配置 因为Producer相对于consumer比较简单,直接看代码...
阅读全文
posted @ 2014-06-23 13:52 fxjwind
阅读(6397)
评论(8)
推荐(0)
编辑
Kafka Tools
摘要: 参考, https://cwiki.apache.org/confluence/display/KAFKA/System+Tools https://cwiki.apache.org/confluence/display/KAFKA/Replication+tools http://kafka.ap
阅读全文
posted @ 2014-06-18 13:59 fxjwind
阅读(11042)
评论(2)
推荐(0)
编辑
Kafka Consumer接口
摘要: 对于kafka的consumer接口,提供两种版本, high-level 一种high-level版本,比较简单不用关心offset, 会自动的读zookeeper中该Consumer group的last offset 参考,https://cwiki.apache.org/confluence/display/KAFKA/Consumer+Group+Example 不过要...
阅读全文
posted @ 2014-06-18 11:26 fxjwind
阅读(40113)
评论(1)
推荐(3)
编辑
Andrew Ng机器学习公开课笔记 -- 学习理论
摘要: 网易公开课,第9,10课 notes,http://cs229.stanford.edu/notes/cs229-notes4.pdf 这章要讨论的问题是,如何去评价和选择学习算法 Bias/variance tradeoff 还是用这组图,学习算法追求的是generalization error(对未知数据的预测误差),而不是training error(只是对训练集) ...
阅读全文
posted @ 2014-06-06 14:08 fxjwind
阅读(2517)
评论(0)
推荐(2)
编辑
HyperLogLog in Practice: Algorithmic Engineering of a State of The Art Cardinality Estimation Algorithm
摘要: HyperLogLog参考下面这篇blog, http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-iv.html 为何LLC在基数不大的时候会误差比较大? 直观上,由于基数不大时,会有很多空桶,而最终结果是求平均值,这个值对离群值(这里的0)非常敏感 那么重理论上看,为何误差比较...
阅读全文
posted @ 2014-05-27 16:01 fxjwind
阅读(1328)
评论(0)
推荐(0)
编辑
上一页
1
···
24
25
26
27
28
29
30
31
32
···
53
下一页
导航
博客园
首页
联系
订阅
管理
公告