上一页 1 ··· 21 22 23 24 25 26 27 28 29 ··· 39 下一页
  2020年9月1日
摘要: 随机森林是一种元估计量,它适合数据集各个子样本上的许多决策树分类器,并使用平均数来提高预测准确性和控制过度拟合。子样本大小由max_samples参数bootstrap=True (default)控制,否则整个数据集用于构建每棵树 随机森林优势 随机森林算法几乎不需要输入的准备。它们不需要测算就能 阅读全文
posted @ 2020-09-01 17:26 小小喽啰 阅读(5689) 评论(0) 推荐(0) 编辑
  2020年8月31日
摘要: 推荐几个不错的国内镜像 阿里云:https://mirrors.aliyun.com/pypi/simple/ 豆瓣:https://pypi.douban.com/simple/ 清华大学:https://pypi.tuna.tsinghua.edu.cn/simple/ 中国科学技术大学 htt 阅读全文
posted @ 2020-08-31 18:25 小小喽啰 阅读(23822) 评论(0) 推荐(0) 编辑
摘要: Main: Template.py Template.py 为主要流程部分,依次实现: Train Test Split Missing Imputation Feature Selection Cap and Floor Data Scaling Model Selection Feature R 阅读全文
posted @ 2020-08-31 17:10 小小喽啰 阅读(279) 评论(0) 推荐(0) 编辑
摘要: 函数用法 numpy.argsort(a, axis=-1, kind=’quicksort’, order=None) 功能: 将矩阵a按照axis排序,并返回排序后的下标,axis=0是列,1是行参数: a:输入矩阵, axis:需要排序的维度返回值: 输出排序后的下标 import numpy 阅读全文
posted @ 2020-08-31 17:02 小小喽啰 阅读(6613) 评论(0) 推荐(0) 编辑
摘要: 具体用法详情请看:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.mask.html, 现在主要说一下区别: where 是条件为False才替换,而mask是条件为True才替换 import 阅读全文
posted @ 2020-08-31 15:17 小小喽啰 阅读(1680) 评论(0) 推荐(0) 编辑
摘要: sklearn.feature_selection.VarianceThreshold 方差阈值法,用于特征选择,过滤器法的一种,去掉那些方差没有达到阈值的特征。默认情况下,删除零方差的特征 函数用法: class sklearn.feature_selection.VarianceThreshol 阅读全文
posted @ 2020-08-31 14:39 小小喽啰 阅读(5120) 评论(0) 推荐(0) 编辑
摘要: python .tolist() 将数组或者矩阵转换成list from numpy import * a1 = [[1,2,3],[4,5,6]] #列表 a2 = array(a1) #数组 a2 ''' array([[1, 2, 3], [4, 5, 6]]) ''' a3 = mat(a1 阅读全文
posted @ 2020-08-31 14:18 小小喽啰 阅读(6922) 评论(0) 推荐(0) 编辑
摘要: 嵌入式特征选择在学习器训练过程中自动地进行特征选择。嵌入式选择最常用的是L1正则化与L2正则化。 SelectFromModel是一个元变压器,可与拟合后具有coef_或feature_importances_属性的任何估算器一起使用。如果相应的coef_或feature_importances_值 阅读全文
posted @ 2020-08-31 12:22 小小喽啰 阅读(3873) 评论(0) 推荐(0) 编辑
摘要: sklearn.model_selection.StratifiedShuffleSplit 主要用于数据不均匀的时候,比如在医疗数据当中得癌症的人比不得癌症的人少很多,此交叉验证对象是StratifiedKFold和ShuffleSplit的合并,返回分层的随机折叠。折叠是通过保留每个类别的样品百 阅读全文
posted @ 2020-08-31 11:23 小小喽啰 阅读(1143) 评论(0) 推荐(0) 编辑
摘要: 工作中,我们可能会遇到需要每天给领导发送邮箱,数据来源是hive,并且格式基本一致,那么下面这些代码就可是使用得到 # coding: utf-8 import sys reload(sys) sys.setdefaultencoding('utf-8') import time import da 阅读全文
posted @ 2020-08-31 10:49 小小喽啰 阅读(563) 评论(0) 推荐(0) 编辑
上一页 1 ··· 21 22 23 24 25 26 27 28 29 ··· 39 下一页