2018 年 11月 23 日随笔档案 - Sakura_L

2018年11月23日

摘要： PCA主成分分析如果只是打分一次会有很多偶然因素所以应该做交叉验证使用PCA来对数据进行降维对比散点图 plt.scatter(data[:,0],data[:,1],c=target) plt.scatter(pca_data[:,0],pca_data[:,1],c=target) 阅读全文

posted @ 2018-11-23 11:18 Sakura_L 阅读(687) 评论(0) 推荐(0) 编辑

交叉验证

摘要：交叉验证以鸢尾花数据集为例得到的是一个有10个元素的一维数组网格搜索网格搜索是针对参数使用不同的参数来看哪一个参数的情况下模型的效果更好 # grid 必须先训练训练好之后才能获取各种 best... 集成学习随机森林就是一种集成学习的方式只不过随机森林中所有的模型都是决策树我们这阅读全文

posted @ 2018-11-23 10:52 Sakura_L 阅读(378) 评论(0) 推荐(0) 编辑

各模型选择及工作流程

摘要：速度问题不同的算法之间,必然有不同的应用场景,比如knn的训练时间特别短,但是使用的时候消耗的时间就比较长,因为训练的时候他只是记录了各个点的位置,并没有做别的事而lgc(逻辑回归)训练的时间比较长,要计算各种权重,通过梯度下降找到最优解,但是使用的过程中就比较快,因为模型已经训练完毕了,后续只阅读全文

posted @ 2018-11-23 10:00 Sakura_L 阅读(492) 评论(0) 推荐(0) 编辑

Sakura_L

Not pleased by external gains, not saddened by personal losses.

公告