摘要: https://zhuanlan.zhihu.com/p/30953081 macro是宏平均,就是先计算P1 R1 P2 R2 ...然后得到Pmean Rmean, 再计算Fmacro, 而micro是微平均,是P=准确率=判对的/全部,而R=召回的/全部 Pmacro=Rmacro=Accur 阅读全文
posted @ 2020-05-21 17:36 yjy888 阅读(417) 评论(0) 推荐(0) 编辑
摘要: roc_auc_score(Receiver Operating Characteristics(受试者工作特性曲线,也就是说在不同的阈值下,True Positive Rate和False Positive Rate的变化情况)) 我们只考虑判为正的情况时,分类器在正例和负例两个集合中分别预测,如 阅读全文
posted @ 2020-05-21 15:03 yjy888 阅读(13543) 评论(0) 推荐(2) 编辑
摘要: 1、聚类模型 from sklearn.cluster import Kmeans 2、数据集 from sklearn.datasets import load_iris sklearn标准数据结构 data = [[feature1,feature2,feature3]*nsample] tar 阅读全文
posted @ 2020-05-21 11:51 yjy888 阅读(1875) 评论(0) 推荐(0) 编辑
摘要: dataframe整个列进行赋值的时候,应该使用loc或者iloc df.loc[:,col] =(df[col]-df[col].mean())/df[col].std() 阅读全文
posted @ 2020-05-21 10:54 yjy888 阅读(108) 评论(0) 推荐(0) 编辑
摘要: https://www.analyticsvidhya.com/blog/2016/03/complete-guide-parameter-tuning-xgboost-with-codes-python/ 阅读全文
posted @ 2020-05-21 09:24 yjy888 阅读(189) 评论(0) 推荐(0) 编辑