误差

一 误差

  1. 预测有失精准并不稀奇。需要在进行预测时指出误差范围,就能知道平均预测值,还能知道该误差造成的典型偏差。指出误差可以让预测和信念更全面。

  2. 回归方程预测的是平均结果,用回归方程预测数据范围之外的数字成为外插法。外插法与内插法不同,内插法对数据范围内的点进行预测这正是回归法的本来目的。内插法很准确,但使用外插法则需格外小心。如果打算使用外插法,就需要指定附加假设条件,明确表示不考虑数据集外发生的情况。在回归方程生成时,需要限定范围,以避免外插。

  3. 机会误差。

  机会误差=实际结果与模型预测结果之间的偏差,无论回归分析是否无可挑剔,都免不了要进行这样那样的预测。这些预测很少不偏不倚,这种实际结果与预测结果之间的偏差叫做机会偏差,机会误差又称为残差,对残差的分析是优秀的统计模型的核心。

  指出误差并不意味着分析是错误的,只能说明对预测的真实程度无所隐瞒,客户越是理解预测,越是能根据预测作出正确的决策。

  4. 误差数据。

  误差不可避免,可以定量的指定误差。需要一个统计值,通过它体现出典型的点(观察结果)相对于回归线的平均偏移量---标准偏差:体现出典型的点相对于平均观察结果的偏差。

  用均方根误差定量的表示残差分布,有了回归线的均方根误差,就能告诉客户实际结果与典型预测结果之间可能有多大差距。

  标准偏差描述的是平均值周围的分布情况,描述的是一个变量;均方根误差描述的是回归线周围的分布情况,指出两个变量之间的关系。

  R或其他统计软件中都可以直接求出均方根误差

  5. 分割

  将数据分拆为几个组成为分割。如果为几个分组分别创建预测模型比单独使用一个模型更能减小误差,则应进行分割。将数据分割成几个分组,并为每个分组建立一个模型,将能对数据分布情况给出更切合实际的解释。将数据分组后,统计结果更敏感,更能体现各个分区内的情况,从而有助于管理误差。

  分别对各分组建立新模型,并添加限制条件和显示均方根误差形成更合理的算法。

 

posted @ 2015-06-03 22:33  amberblue  阅读(445)  评论(0编辑  收藏  举报