12 2018 档案
摘要:前述知识见二值变量间的相关性分析 dc系数,这里作者是用自己名字命名,也是区分度相关系数的一个缩写。 关于dc系数的表达式我们可以使用如下的表达式,该表达式要比第一个表达式更优。因为区分度d实际上是一个平方项,开发之后的sqrt(d)能更好的刻画区分度,所以dc系数为: 即我们用新的区分度sqrt(
阅读全文
摘要:二值类别变量相关性分析 目前,在相关性分析领域,主要使用的技术指标有pearson相关系数、spearman相关系数、kendall相关系数。三者有一个共同的特点,它们都是通过两组数据的元素大小来刻画相关性,也即同增同减的性质。在分类、聚类领域中,为了弥补上述相关性的不足,科学家将距离、方向引入相关
阅读全文