2018年7月17日

机器学习Hands On Lab

摘要: fetch_data fetch_mldata默认路径是在scikit_learn_data路径下,mnist的mat文件其实直接放置到scikit_lean/mldata下面即可通过fetch_mldata中获取;当然路径信息其实是fetch_home函数中定义的; 洗牌训练数据 为了避免数据的有序对于训练的影响,有的时候需要对于数据进行随机排列;比如对于7万个手写数字的样本,前... 阅读全文

posted @ 2018-07-17 22:05 张叫兽的技术研究院 阅读(196) 评论(0) 推荐(0) 编辑

Decision_function:scores,predict以及其他

摘要: 机器学习的评估 PR曲线用于positive类数据占比比较小,或者你更加在意false postion(相比于false negative);其他情况采用ROC曲线;比如Demo中手写体5的判断,因为只有少量5,所以从ROC上面来看分类效果不错,但是从PR曲线可以看到分类器效果不佳。 y_scores = sgd_clf.decision_function([some_digit]) deci... 阅读全文

posted @ 2018-07-17 22:02 张叫兽的技术研究院 阅读(12639) 评论(0) 推荐(0) 编辑

混淆矩阵

摘要: 混淆矩阵(Confusion Matrix) 混淆矩阵是一个列表,里面包含了实际值和判断值的情况。下图是信息更加丰富的一张混淆矩阵图: 作为良好的学习模型,TN和TP值是高的,FP和FN值=0;但是很多场景下FP和FN都不是0,那么怎么评价个分类学习的效果(performance)呢? Accuracy:全准率 (TP+TN)/total = (100+50)/165 = ... 阅读全文

posted @ 2018-07-17 21:52 张叫兽的技术研究院 阅读(813) 评论(0) 推荐(0) 编辑

机器学习之画图

摘要: 关于画图 在现实数字的时候代码如下: 注意reshape参数里面是长和宽,一定要保证长*宽的值是784;否则就会和数据本身不符,运行报错;(28,28)可过,(1, 784)亦可以通过。 imshow是设置图片的展示,cmap意思是color map,颜色方案,binary代表是白底黑字; 关于图谱 阅读全文

posted @ 2018-07-17 21:45 张叫兽的技术研究院 阅读(1111) 评论(0) 推荐(0) 编辑

导航