摘要: 数据挖掘和统计学是交集的关系,它们之间有很强的关系,但不是一个涵盖另一个。统计学是从小样本数据分析,推测总体的特征。而数据挖掘是从尽可能大的数据集上直接寻找特征。应用方法上,数据挖掘多用于主动式的发现,而统计学多用于被动式的验证。从大量的商业项目实践中,我们体会到数据挖掘探索与统计学分析很多时候结果... 阅读全文
posted @ 2015-05-18 23:57 疯狂的拖鞋 阅读(834) 评论(0) 推荐(0) 编辑
摘要: 卡方检验:分类数据,有无关联性u检验:假定X服从正态分布,方差已知一样本t检验:X服务正态分布,不假定方差已知两样本t检验:X、Y分布服从正态分布,假定X、Y等方差。若方差都未知也不必相同,则是贝伦斯-费歇耳问题。若方差已知但不等,则可用区间估计方法解决。符号检验法:不基于正态假定,非参数统计方法秩... 阅读全文
posted @ 2015-05-18 23:45 疯狂的拖鞋 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 相关不等于因果……在日常生活中常听到“某某两事关系不大”的说法。它所指的与我们这里谈论的两事物(变量)的相关性,不一定是一个意思。举个很粗浅的例子,例如两变量X,Y之间,存在由下式表达的严格关系X=(0.00001)Y这是一个严格的线性关系。相关系数等于1。按前面所证,X、Y的相关系数为1时,达到最... 阅读全文
posted @ 2015-05-18 10:38 疯狂的拖鞋 阅读(228) 评论(0) 推荐(0) 编辑