摘要: 前述知识见二值变量间的相关性分析 dc系数,这里作者是用自己名字命名,也是区分度相关系数的一个缩写。 关于dc系数的表达式我们可以使用如下的表达式,该表达式要比第一个表达式更优。因为区分度d实际上是一个平方项,开发之后的sqrt(d)能更好的刻画区分度,所以dc系数为: 即我们用新的区分度sqrt( 阅读全文
posted @ 2018-12-10 14:56 巴蜀秀才 阅读(872) 评论(0) 推荐(0) 编辑
摘要: 二值类别变量相关性分析 目前,在相关性分析领域,主要使用的技术指标有pearson相关系数、spearman相关系数、kendall相关系数。三者有一个共同的特点,它们都是通过两组数据的元素大小来刻画相关性,也即同增同减的性质。在分类、聚类领域中,为了弥补上述相关性的不足,科学家将距离、方向引入相关 阅读全文
posted @ 2018-12-10 14:32 巴蜀秀才 阅读(10837) 评论(4) 推荐(0) 编辑