我的下铺刚田武

2018年11月13日

摘要：线性回归创建的预测模型需要拟合所有的样本点，在数据拥有众多特征并且特征之间关系十分复杂时，构建全局模型太难，而且，生活中很多问题是非线性的，不可能使用全局线性模型来拟合任何数据。一种可行的方法是把数据集切分成很多分易建模的数据，然后利用线性回归技术来建模。如果首次切分后仍然难以拟合线性模型就继续切阅读全文

posted @ 2018-11-13 21:54 我的下铺刚田武阅读(497) 评论(0) 推荐(0) 编辑

2018年11月12日

python nonzero()

摘要：返回非零元素的索引值。返回的是元组，元组的维数和参数的维数相同。输出：实用举例：输出：阅读全文

posted @ 2018-11-12 20:46 我的下铺刚田武阅读(267) 评论(0) 推荐(0) 编辑

numpy 矩阵和数组

摘要：矩阵只能是二维的，数组可以任意维度。对于矩阵：输出：对于数组：输出：对于list: 输出：阅读全文

posted @ 2018-11-12 20:28 我的下铺刚田武阅读(117) 评论(0) 推荐(0) 编辑

python map()

摘要： map()：根据提供的函数对指定序列做映射。调用：第一个参数 func表示函数，第二个参数是可迭代类型的数据，返回iterable里的元素调用func后的结果组成的迭代器。输出：阅读全文

posted @ 2018-11-12 19:49 我的下铺刚田武阅读(109) 评论(0) 推荐(0) 编辑

2018年11月8日

python matplotlib plot

摘要：绘制矩阵：默认横坐标为0,1,2,3…… 输出：设置横坐标：-3，-2，-1,0 axisX的元素个数要与矩阵的行数相等。输出：阅读全文

posted @ 2018-11-08 23:00 我的下铺刚田武阅读(229) 评论(0) 推荐(0) 编辑

python mean()

摘要：对于矩阵：输出：<class 'numpy.matrixlib.defmatrix.matrix'> 对于数组：输出：<class 'numpy.ndarray'> 阅读全文

posted @ 2018-11-08 22:45 我的下铺刚田武阅读(18675) 评论(0) 推荐(0) 编辑

预测数值型数据：回归

摘要：线性回归找到最佳拟合直线：寻找使得拟合误差最小的线性回归系数w 采用平方误差。标准回归函数和数据载入函数：返回值ws即为回归系数，因为训练数据集上只有两个特征，所以ws只有两个元素。预测值计算： yHat=ws[0]*x[0]+ws[1]*x[1] 向量形式：yHat=WS*X 绘制数据集散点阅读全文

posted @ 2018-11-08 22:39 我的下铺刚田武阅读(593) 评论(0) 推荐(0) 编辑

散点图

摘要：数据集是矩阵时：阅读全文

posted @ 2018-11-08 09:30 我的下铺刚田武阅读(128) 评论(0) 推荐(0) 编辑

2018年11月7日

非均衡分类问题

摘要：非均衡分类问题： 1、样本正反例数量差距大； 2、不同类别的分类代价不相等。除了分类错误率，还有以下分类性能度量指标：正确率、召回率和ROC曲线正确率：预测为正例的样本中真正正例的比例。召回率：预测为正例的真实正例占所有真实正例的比例。正确率和召回率很难同时达到很高。 ROC曲线：横轴为伪正阅读全文

posted @ 2018-11-07 22:18 我的下铺刚田武阅读(166) 评论(0) 推荐(0) 编辑

AdaBoost元算法

摘要： boosting：不同的分类器是通过串行训练而获得的，每个新分类器都根据已经训练出的分类器的性能来进行训练。通过集中关注被已有分类器错分的那些样本来获得新的分类器。权重alpha：弱分类器的线性组合系数，用来构成完整分类器。对每个数据的分类时，其结果是弱分类器结果的线性组合。权重D：样本的权重向阅读全文

posted @ 2018-11-07 20:51 我的下铺刚田武阅读(275) 评论(0) 推荐(0) 编辑

我的下铺刚田武

公告