摘要: 嵌套交叉验证(nested cross validation)选择算法(外循环通过k折等进行参数优化,内循环使用交叉验证),对特定数据集进行模型选择。Varma和Simon在论文Bias in Error Estimation When Using Cross-validation for Mode 阅读全文
posted @ 2020-12-01 09:09 17孤独的牧羊人 阅读(475) 评论(0) 推荐(0) 编辑
摘要: sklearn.preprocessing.PolynomialFeatures 生成多项式和交互特征。生成由度小于或等于指定度的特征的所有多项式组合组成的新特征矩阵。例如,如果输入样本是二维且格式为[a,b],则2阶多项式特征为[1,a,b,a ^ 2,ab,b ^ 2] class sklear 阅读全文
posted @ 2020-12-01 08:58 17孤独的牧羊人 阅读(389) 评论(0) 推荐(0) 编辑
摘要: 导入数据: from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import train_test_split from sklearn.model_selection import KFol 阅读全文
posted @ 2020-11-30 21:00 17孤独的牧羊人 阅读(120) 评论(0) 推荐(0) 编辑
摘要: pd.melt参数: rame : DataFrame id_vars:tuple, list,或ndarray,可选。用作标识符变量的列。 value_vars:tuple, list, 或 ndarray,可选。要unpivot的列。如果未指定,则使用未设置为id_vars的所有列。 var_n 阅读全文
posted @ 2020-11-30 19:47 17孤独的牧羊人 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 批量数据处理替换 字符串替换: six = "[北京、上海、深圳、广州]"six.replace('、' ,"','")#结果:''' "[北京','上海','深圳','广州]"''' 字符串截取: six.split('-') 字符串查找: six.find('-') > -1 阅读全文
posted @ 2020-11-30 11:58 17孤独的牧羊人 阅读(51) 评论(0) 推荐(0) 编辑
摘要: pd.set_option("display.max_rows", 1000) pd.set_option("display.max_columns", 100) pd.set_option("display.max_colwidth", 1000) 阅读全文
posted @ 2020-11-27 10:36 17孤独的牧羊人 阅读(379) 评论(0) 推荐(0) 编辑
摘要: 列表表达式 生成器 阅读全文
posted @ 2020-11-11 10:39 17孤独的牧羊人 阅读(42) 评论(0) 推荐(0) 编辑