摘要:
之前介绍了C5.0的内容,今天将描述超市购物篮内容(所购买的全部商品的集合)的虚构数据,以及购买的相关个人数据(通过忠诚卡方案获得)。目的是寻找购买相似产品并且可按人口统计学方式(年龄,收入)刻画其特征的客户群。要做这项工作,要进行两个阶段的工作:关联规则建模和一个解释所购买商品之间联系的WEB显示;C5.0规则归纳(描绘已标识产品组的购买者的特征)Note:此应用不直接使用预测模型,因此,不对最终模型进行准确性度量,在数据挖掘过程中也不存在与之相关的训练/检验两个步骤的区分。本例使用baskrule的流,该流引用名为BASKETS1n的数据文件。这些文件可在Clementine安装文件的De 阅读全文