02 2020 档案

摘要:如何找出模型需要的特征?首先要找到该领域的业务专家,让他们给一些建议。比如我们需要解决一个药品疗效的分类问题,那么先找到领域专家,向他们咨询哪些因素(特征)会对该药品的疗效产生影响,较大影响和较小影响的因素都要。这些因素就是我们特征的第一候选集。(摘自:https://www.cnblogs.com 阅读全文
posted @ 2020-02-29 10:33 HuZihu 阅读(2944) 评论(0) 推荐(0) 编辑
摘要:线性回归模型比较常见的特征选择方法有两种,分别是最优子集和逐步回归。此外还有正则化,降维等方法。 1,最优子集(Best Subset Selection):从零号模型(null model)M0开始,这个模型只有截距项而没有任何自变量。然后用不同的特征组合进行拟合,从中分别挑选出一个最好的模型(R 阅读全文
posted @ 2020-02-21 22:22 HuZihu 阅读(19512) 评论(0) 推荐(0) 编辑
摘要:在《机器学习 最小二乘线性回归模型的5个基本假设(Machine Learning Least Squares Linear Regression Assumptions)》一文中阐述了最小二乘线性回归的5个基本假设以及违反这些假设条件会产生的后果。那么,我们怎么检测出是否有违反假设的情况出现以及如 阅读全文
posted @ 2020-02-16 18:21 HuZihu 阅读(1798) 评论(0) 推荐(0) 编辑
摘要:一,定义 异常点(Outlier):残差很大的点(即:因变量y的值是极端值的观测值) 高杠杆点(High Leverage Point):远离样本空间中心的点(即:自变量x的值是极端值的观测值) 强影响点(Influential Point):对模型有较大影响的点,如果删除该点能改变拟合回归方程 注 阅读全文
posted @ 2020-02-16 10:49 HuZihu 阅读(19521) 评论(2) 推荐(2) 编辑

点击右上角即可分享
微信分享提示