摘要:
线性回归创建的预测模型需要拟合所有的样本点,在数据拥有众多特征并且特征之间关系十分复杂时,构建全局模型太难,而且,生活中很多问题是非线性的,不可能使用全局线性模型来拟合任何数据。 一种可行的方法是把数据集切分成很多分易建模的数据,然后利用线性回归技术来建模。如果首次切分后仍然难以拟合线性模型就继续切 阅读全文
摘要:
返回非零元素的索引值。返回的是元组,元组的维数和参数的维数相同。 输出: 实用举例: 输出: 阅读全文
摘要:
矩阵只能是二维的,数组可以任意维度。 对于矩阵: 输出: 对于数组: 输出: 对于list: 输出: 阅读全文
摘要:
map():根据提供的函数对指定序列做映射。 调用: 第一个参数 func表示函数,第二个参数是可迭代类型的数据,返回iterable里的元素调用func后的结果组成的迭代器。 输出: 阅读全文
摘要:
绘制矩阵:默认横坐标为0,1,2,3…… 输出: 设置横坐标:-3,-2,-1,0 axisX的元素个数要与矩阵的行数相等。 输出: 阅读全文
摘要:
对于矩阵: 输出:<class 'numpy.matrixlib.defmatrix.matrix'> 对于数组: 输出:<class 'numpy.ndarray'> 阅读全文
摘要:
线性回归找到最佳拟合直线:寻找使得拟合误差最小的线性回归系数w 采用平方误差。 标准回归函数和数据载入函数: 返回值ws即为回归系数,因为训练数据集上只有两个特征,所以ws只有两个元素。 预测值计算: yHat=ws[0]*x[0]+ws[1]*x[1] 向量形式:yHat=WS*X 绘制数据集散点 阅读全文
摘要:
数据集是矩阵时: 阅读全文
摘要:
非均衡分类问题: 1、样本正反例数量差距大; 2、不同类别的分类代价不相等。 除了分类错误率,还有以下分类性能度量指标:正确率、召回率和ROC曲线 正确率:预测为正例的样本中真正正例的比例。 召回率:预测为正例的真实正例占所有真实正例的比例。 正确率和召回率很难同时达到很高。 ROC曲线:横轴为伪正 阅读全文
摘要:
boosting:不同的分类器是通过串行训练而获得的,每个新分类器都根据已经训练出的分类器的性能来进行训练。通过集中关注被已有分类器错分的那些样本来获得新的分类器。 权重alpha:弱分类器的线性组合系数,用来构成完整分类器。对每个数据的分类时,其结果是弱分类器结果的线性组合。 权重D:样本的权重向 阅读全文