第七章:数据挖掘建模的优化和限度

 

7.1数据挖掘模型的优化要遵循有效、适度的原则

  • 有效原则:模型的结论或者应用效果是否满足当初业务需求
  • 适度原则:投入产出性价比

7.2如何有效地优化模型

7.2.1从业务思路上优化模型是最重要的模型优化措施

  • 有没有更加明显且直观的规则、指标可以代替复杂的建模
  • 有没有一些明显的业务逻辑(业务假设)在前期的建模阶段被疏忽
  • 通过前期的初步建模和数据熟悉,是否有新的发现,甚至能颠覆之前的业务推测或者业务直觉
  • 目标变量的定义是否稳定(在不同的时间点抽样验证)

7.2.2从建模的技术思路上优化

7.2.3从建模的技术技巧上优化

7.3如何思考优化的限度

7.4模型效果评价的主要指标体系(二元目标变量)

7.4.1评价模型准确度和精度的系列指标

  • True Positive(TP):指模型预测为正(1)的,并且实际上也的确是正(1)的观察对象数量
  • True Negative(TN):指模型预测为负(0)的,并且实际上也的确是正(0)的观察对象数量
  • False Positive(FP):指模型预测为正(1)的,并且实际上是负(0)的观察对象数量
  • False Negative(FN):指模型预测为负(0)的,并且实际上是正(1)的观察对象数量

     

posted @ 2018-10-14 23:47  起航追梦人  阅读(471)  评论(0编辑  收藏  举报