数据变换

介绍了为什么我们需要转换数据“如果要对数据进行统计检验的话,很多常用的检验方法都会假设数据服从某种特定的分布(比如正态分布)”,也介绍了转换的相关细节。

摘录一些:

要问到底哪种方法更适合呢?这个问题没有确定的答案。尽管有选择转换方式的正规统计方法, 实际应用中还是要结合各种转换方法的特点,反复试验。通用的策略是分别使用各种常见的转换方法,包括取对数、求平方根、平方、倒数、立方根等,然后观察结果,来确定最适合的转换方法。

常用的转换方式:

方法:取对数
数学运算ln(x),log10(x)
适合于:右偏态数据,log10(x)特别适合处理10的高阶次幂(比如1000,100000)
不适合于:零值、负数

方法:平方根
数学运算:√x
适合于:右偏态数据
不适合于:负数

方法:平方
数学运算:x2
适合于:左偏态数据
不适合于:负数

方法:立方根
数学运算:x1/3
适合于:右偏态数据、负数
不适合于:在数据归一化方面效果不如对数转换

方法:取倒数
数学运算:1/x
适合于:使小值变大,大值变小
不适合于:零值、负数

posted on 2020-11-19 17:11  不忘初衷,方能致远  阅读(250)  评论(0编辑  收藏  举报

导航