kalor

导航

 

2013年6月24日

摘要: Weka EM covariancedescription 1:Dear All, I am trying to find out what is the real meaning of the minStdDev parameter in the EM clustering algorithm. Can anyone help me? I have not looked at the code, but I suspect that the minStdDev is used as the first estimate of the covariance of a Gaussian in.. 阅读全文
posted @ 2013-06-24 19:18 kalor 阅读(406) 评论(0) 推荐(0) 编辑
 
摘要: 所谓数据挖掘,就是通过数据分析,发现其中的规律。 沈浩教授列举了彩票的数据分析的案例,指出彩票的大范围的概率均等性以及小范围的概率波动。曾经中央电视台新闻30分采访过他,他指出了所谓的彩票软件是骗人的。如果彩票的规律是可循的,那么显然彩票是没法玩的,知道规律的人也不会说出规律来的。 最震撼的是沈浩教授用数据挖掘的原理,讲述了SNS社会关系网络的用户关系和路径分析图。通过用户彼此之间的沟通线条,通过分析软件转化为层级图或密度分布图,就可以发现哪些人是“意见领袖”。在营销中,新产品上市的宣传推广,首先要影响的就是这部分的“意见领袖”,他们是社会信息的重要传播者和影响者。 通过数据挖掘... 阅读全文
posted @ 2013-06-24 18:38 kalor 阅读(392) 评论(0) 推荐(0) 编辑
 
摘要: 统计学的基本概念学过概率统计的孩子都知道,统计里最基本的概念就是样本的均值,方差,或者再加个标准差。首先我们给你一个含有n个样本的集合,依次给出这些概念的公式描述,这些高中学过数学的孩子都应该知道吧,一带而过。均值:方差: 均值方差的意义我就不多说了,均值就是描述样本总体水品的,班级平均分你总归明白的吧。方差呢就是描述样本稳定性的,比如你的成绩,一会儿全班第一,一会儿不及格,这就是方差很大。张三总是在班级前十,但也没当过第一,这方差就比较小。 那么协方差到底是做什么用的呢? 我们一直在讨论一个随机变量的情况,一个随机变量的均值,一个随机变量的方差,当涉及到两个随机变量的时候,有时候我们要... 阅读全文
posted @ 2013-06-24 16:17 kalor 阅读(1215) 评论(0) 推荐(1) 编辑