摘要:
本文讲解如何使用R语言中e1071包中的SVM函数进行分类操作,并以一个关于鸢尾花分类的实例演示具体分类步骤。 阅读全文
摘要:
这部分也许是数据预处理最为关键的一个阶段。
如何对数据降维是一个很有挑战,很有深度的话题,很多理论书本均有详细深入的讲解分析。
本文仅介绍主成分分析法(PCA)和探索性因子分析法(EFA),并给出具体的实现步骤。 阅读全文
摘要:
在进行缺失,异常处理之后,往往要对数据进行变换。
变换有多种情况,主要是以下两种:
- 规范化:对数据进行一定比例的缩放,让它实质落入某个具体区间。
- 离散化:将连续型数据转化为离散化。 阅读全文
摘要:
数据中如果有某个值偏离该列其他值比较离谱,那么就有可能是一个异常的值。在数据预处理中,自然需要把这个异常值检测出来,然后剔除掉,或者光滑掉,或者其他各种方法进行处理。
需要注意的是,本文仅介绍最为基础的单维度异常检测及处理方法,而在实际应用中更多用到的是多维度异常检测,这部分得到时结合具体项目学习。 阅读全文