摘要:
在做数据处理时,需要用到不同的手法,如特征标准化,主成分分析,等等会重复用到某些参数,sklearn中提供了管道,可以一次性的解决该问题 先展示先通常的做法 先对数据标准化,然后做主成分分析降维,最后做回归预测 现在使用管道 Pipeline对象接收元组构成的列表作为输入,每个元组第一个值作为变量名 阅读全文
摘要:
关于偏差、方差以及学习曲线为代表的诊断法: 在评估假设函数时,我们习惯将整个样本按照6:2:2的比例分割:60%训练集training set、20%交叉验证集cross validation set、20%测试集test set,分别用于拟合假设函数、模型选择和预测。 模型选择的方法为: 1. 使 阅读全文