摘要: 2017-12-04 16:31:10 数据预处理(data preprocessing)是指在主要的处理以前对数据进行的一些处理。 比如缺项,噪声(工资=-100),不匹配(年龄和出生日期不匹配),冗余等等。 一、数据清洗 1)缺少数据 可能的原因有设备故障,数据没有提供,N/A不适用。 缺少数据 阅读全文
posted @ 2017-12-04 22:36 hyserendipity 阅读(1536) 评论(0) 推荐(0) 编辑
摘要: 2017-12-02 14:27:18 一、术语 Items:项,简记I Transaction:所有项的一个非空子集,简记T Dataset:Transaction的一个集合,简记D 关联规则: 一个Dataset的例子: 我们的目的就是找到类似买了面包->黄油这样的关联关系。 二、支持度与置信度 阅读全文
posted @ 2017-12-04 15:02 hyserendipity 阅读(932) 评论(0) 推荐(0) 编辑