03 2021 档案
摘要:曲线: P-R X轴是Percision, Y轴是Reall。 Percision=TP/FP+TP,也就是预测是阳性并且正确的/预测是阳性的。这个值大意味着这个模型预测出来的阳性很多都是对的,当置信度大时,一般精确度也大。 Recall=TP/TP+FN, 也就是预测是阳性并且正确/所有的阳性。R
阅读全文
摘要:Stacking是堆叠的意思,把多个模型堆叠到一起。 它通过一个元模型把数据堆叠到一起,这个元模型训练的特征就是模型+模型输出的结果,标签是训练集的y。 预测时用所有的模型预测一遍,得到的结果作为特征给元模型,输出最终的结果。 from sklearn import datasets X, y =
阅读全文
摘要:from sklearn.inspection._permutation_importance import permutation_importance from sklearn.datasets import load_iris from sklearn.metrics import get_s
阅读全文
摘要:相同二级域名下子系统间相互SSO 有2个应用,域名分别为: tv.home.com game.home.com 它们的cookies可以写在域名home.com下,登陆服务部署在sso.home.com下。访问任何一个服务时都去home.com下读取cookies检查用户是否登陆,如果没有登陆,则跳
阅读全文
摘要:思路: 评价测试集与训练集分布是否相像,如果不像,则有可能是发生了漂移。 评价方法: 对训练集打标签0,测试集打标签1生成新数据集 训练一个二分类模型 评价AUC指标,如果非常高,则发生漂移(模型能轻易分辨出训练和测试数据) 依据特征重要性,删除若干个指标,重新训练,并重复步骤2-4,直到auc很低
阅读全文