摘要: 一、standardization 之所以标准化的原因是,如果数据集中的某个特征的取值不服从标准的正太分布,则性能就会变得很差 ①函数scale提供了快速和简单的方法在单个数组形式的数据集上来执行标准化操作 ②Preprocessing还提供了一个类StandarScaler,该类实现了变换器的AP 阅读全文
posted @ 2017-06-13 16:53 nolonely 阅读(2988) 评论(0) 推荐(0) 编辑
摘要: 特征抽取sklearn.feature_extraction 模块提供了从原始数据如文本,图像等众抽取能够被机器学习算法直接处理的特征向量。 1.特征抽取方法之 Loading Features from Dicts 2.特征抽取方法之 Features hashing 3.特征抽取方法之 Text 阅读全文
posted @ 2017-06-13 11:39 nolonely 阅读(2128) 评论(3) 推荐(1) 编辑