摘要: PCA主成分分析 如果只是打分一次 会有很多偶然因素所以 应该 做交叉验证 使用PCA来对数据进行降维 对比散点图 plt.scatter(data[:,0],data[:,1],c=target) plt.scatter(pca_data[:,0],pca_data[:,1],c=target) 阅读全文
posted @ 2018-11-23 11:18 Sakura_L 阅读(676) 评论(0) 推荐(0) 编辑
摘要: 交叉验证 以鸢尾花数据集为例 得到的是一个有10个元素的一维数组 网格搜索 网格搜索是针对参数使用不同的参数来看哪一个参数的情况下 模型的效果更好 # grid 必须先训练 训练好之后 才能获取各种 best... 集成学习 随机森林就是一种集成学习的方式 只不过随机森林中所有的模型都是决策树我们这 阅读全文
posted @ 2018-11-23 10:52 Sakura_L 阅读(367) 评论(0) 推荐(0) 编辑
摘要: 速度问题 不同的算法之间,必然有不同的应用场景,比如knn的训练时间特别短,但是使用的时候消耗的时间就比较长,因为训练的时候他只是记录了各个点的位置,并没有做别的事 而lgc(逻辑回归)训练的时间比较长,要计算各种权重,通过梯度下降找到最优解,但是使用的过程中就比较快,因为模型已经训练完毕了,后续只 阅读全文
posted @ 2018-11-23 10:00 Sakura_L 阅读(488) 评论(0) 推荐(0) 编辑