摘要: #include #include #include #include #include #include #include #include #include #include #include using namespace std; // 树节点的结构体 struct TreeNode { int val; TreeNode *left; TreeNod... 阅读全文
posted @ 2019-03-02 11:12 yskn 阅读(1710) 评论(0) 推荐(0) 编辑
摘要: #include #include #include #include #include #include #include #include #include #include using namespace std; //链表的数据结构 struct ListNode { int value; ListNode* next; ListNode () {}; //赋值... 阅读全文
posted @ 2019-02-27 19:13 yskn 阅读(899) 评论(0) 推荐(0) 编辑
摘要: 1.np.random.choice(采集的对象,若是整数则默认np.arange(int),抽取的个数,抽取的样本是否重复) 2.concatenate([a,b],axis=0/1)axis默认为0,为0纵向拼接,1横向拼接 阅读全文
posted @ 2018-10-22 15:27 yskn 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 1.pd.value_count():带入数值可以计算出value有多少的类别 2.sort_values()(按照数值进行排列)/sort_index()(对index/columns的大小进行排列),其中axis=0是默认的值,代表值列 3.reshape():这个是numpy的一个函数,我们可 阅读全文
posted @ 2018-10-21 18:01 yskn 阅读(211) 评论(0) 推荐(0) 编辑
摘要: 一.下采样 对于样本不均衡来说,使得两个样本(向少的样本靠齐)同样的少.将多的数据进行裁剪使得样本最后可以均衡,具体的代码设计如下: 二.过采样 对于样本不均衡来说,使得两个样本(向多的样本靠齐)同样的多(制造多的样本) 阅读全文
posted @ 2018-10-21 17:56 yskn 阅读(399) 评论(0) 推荐(0) 编辑
摘要: kdeplot(核密度估计图) 核密度估计(kernel density estimation)是在概率论中用来估计未知的密度函数,属于非参数检验方法之一。通过核密度估计图可以比较直观的看出数据样本本身的分布特征。具体用法如下: 二元kde图像 distplot displot()集合了matplo 阅读全文
posted @ 2018-10-17 20:10 yskn 阅读(835) 评论(0) 推荐(0) 编辑
摘要: 一.决策树 决策树一般以选择属性的方式不同分为id3(信息增益),c4.5(信息增益率),CART(基尼系数),只能进行线性的分割,是一种贪婪的算法,其中sklearn中的决策树分为回归树和分类树两种,默认的是CART的决策树,下面介绍CART决策树 分支条件:二分类问题(只用来构建二叉树) 分支方 阅读全文
posted @ 2018-10-16 19:19 yskn 阅读(1765) 评论(0) 推荐(0) 编辑
摘要: 一.线性回归 LinearRegression类就是我们平时所说的普通线性回归,它的损失函数如下所示: 对于这个损失函数,一般有梯度下降法和最小二乘法两种极小化损失函数的优化方法,而scikit-learn中的LinearRegression类使用的是最小二乘法。通过最小二乘法,可以解出线性回归系数 阅读全文
posted @ 2018-10-14 16:20 yskn 阅读(614) 评论(0) 推荐(0) 编辑
摘要: sklearn.metrics 1.MSE(均方误差)和RMSE(均方根误差),以及score() 2.混淆矩阵 混淆矩阵的每一列代表了预测类别 ,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目。每一列中的数值表示真实数据被预测为 阅读全文
posted @ 2018-10-14 15:46 yskn 阅读(1618) 评论(0) 推荐(0) 编辑
摘要: 1、随机划分训练集和测试集 sklearn.model_selection.train_test_split 一般形式: train_test_split是交叉验证中常用的函数,功能是从样本中随机的按比例选取train data和testdata,形式为: 参数解释:- train_data:所要划 阅读全文
posted @ 2018-10-12 20:24 yskn 阅读(1605) 评论(0) 推荐(0) 编辑