摘要:1、导入模块 http://scikit-learn.org/stable/modules/generated/sklearn.discriminant_analysis.LinearDiscriminantAnalysis.html#sklearn.discriminant_analysis.Li
阅读全文
摘要:1、原理 https://www.cnblogs.com/zhouxiaohui888/p/6008368.html 2、实战 xgboost中比较重要的参数介绍: (1)学习率:learning rate :一般设置比较低,0.1以下 (2)tree: max_depth min_child_we
阅读全文
摘要:一、GridSearchCV介绍: 自动调参,适合小数据集。相当于写一堆循环,自己设定参数列表,一个一个试,找到最合适的参数。数据量大可以使用快速调优的方法 坐标下降【贪心,拿当前对模型影响最大的参数调优,直到最优,但可能获得的是全局最优】。 二、参数使用 class sklearn.model_s
阅读全文
摘要:1、使用示例 2、树模型参数:【很多参数都是用来限制树过于庞大,即担心其过拟合】 # 1.criterion gini or entropy:用什么作为衡量标准 ( 熵值或者Gini系数 )。 # 2.splitter best or random 前者是在所有特征中找最好的切分点 后者是在部分特征
阅读全文
摘要:1、kfold:自己分样本来交叉验证迭代 导入模块:from sklearn.model_selection import KFold 参数: 导入模块:from sklearn.model_selection import KFold 参数: n_splits:就是将样本分成多少份。进行k折验证
阅读全文
摘要:一、分类度量 1、混淆矩阵: 2、classification_report 3、汉明损失 4、jaccard相似系数得分 5、准确率、召回率和F_measure 3、
阅读全文
摘要:一、【标准化】scale: 1、导入模块 from sklearn.preprocessing import scaler 2、作用:直接将给定数据进行标准化 3、使用代码 二、【标准化】StandardScaler 1、导入模块 from sklearn.preprocessing import
阅读全文
摘要:来自链接:https://blog.csdn.net/zahuopuboss/article/details/54948181 1、sklearn.model_selection.train_test_split随机划分训练集和测试集 官网文档:http://scikit-learn.org/sta
阅读全文
摘要:1、官网地址: http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html 2、class sklearn.linear_model.LogisticRegression
阅读全文
摘要:该博主总结的很好,https://www.cnblogs.com/hellcat/p/7531789.html 1、kaggle给出的导图 2、转化成树图: 3、sklearn工具导图
阅读全文
摘要:1、SVM有两种作用:分类和回归,分类是用SVC,回归用SVR。 2、SVC:(中文官网) 重点在svm.SVC(),fit(X,Y),以及SVC中的参数。 3、SVC参数: ①C,C是控制软间隔中的松弛变量是否起作用,C越大表明越宽松,对松弛变量更容忍,C越小越严格,等于0时表示不允许有数据在支持
阅读全文