02 2020 档案
摘要:如何找出模型需要的特征?首先要找到该领域的业务专家,让他们给一些建议。比如我们需要解决一个药品疗效的分类问题,那么先找到领域专家,向他们咨询哪些因素(特征)会对该药品的疗效产生影响,较大影响和较小影响的因素都要。这些因素就是我们特征的第一候选集。(摘自:https://www.cnblogs.com
阅读全文
摘要:线性回归模型比较常见的特征选择方法有两种,分别是最优子集和逐步回归。此外还有正则化,降维等方法。 1,最优子集(Best Subset Selection):从零号模型(null model)M0开始,这个模型只有截距项而没有任何自变量。然后用不同的特征组合进行拟合,从中分别挑选出一个最好的模型(R
阅读全文
摘要:在《机器学习 最小二乘线性回归模型的5个基本假设(Machine Learning Least Squares Linear Regression Assumptions)》一文中阐述了最小二乘线性回归的5个基本假设以及违反这些假设条件会产生的后果。那么,我们怎么检测出是否有违反假设的情况出现以及如
阅读全文
摘要:一,定义 异常点(Outlier):残差很大的点(即:因变量y的值是极端值的观测值) 高杠杆点(High Leverage Point):远离样本空间中心的点(即:自变量x的值是极端值的观测值) 强影响点(Influential Point):对模型有较大影响的点,如果删除该点能改变拟合回归方程 注
阅读全文