摘要: 1.数据标准化(Standardization or Mean Removal and Variance Scaling) 进行标准化缩放的数据均值为0,具有单位方差。 同样我们也可以通过preprocessing模块提供的Scaler(StandardScaler 0.15以后版本)工具类来实现这 阅读全文
posted @ 2016-04-26 22:31 hudongni1 阅读(2401) 评论(0) 推荐(0) 编辑
摘要: 答:特征抽取:主要是抽取一些与业务相关的特征,文本的话可能会用到一些正则表达式 特征选择:信息增益、卡方检验、互信息 模型参数? 答:一般模型参数不多,最多是多一个正则化项。 3. 网格搜索:主要是优化超参数 模型的fit、fit_transform、.transform: fit直接就是拟合数据, 阅读全文
posted @ 2016-04-26 21:36 hudongni1 阅读(180) 评论(0) 推荐(0) 编辑