摘要: 1.对1项集求支持度(计数) 2.将计数(频度)低于最小值的过滤掉,将剩下的一项集排序(降序) 3.参照排序后的一项集将初始的数据集依次排序 4.将排好序的数据集从根节点开始建树,根节点初始化为空 5.建树的过程中对经过的节点进行计数,得到节点带权重的多叉树 6.对每个节点从节点开始向祖先节点遍历, 阅读全文
posted @ 2018-04-10 18:05 Aemnprsu_wx 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 中心思想: 频繁度高的项对应的子项频繁度也高,频繁度低的项对应子项频繁度也低 对子项求频繁度,选择频繁度高的子项求其所在项的频繁度。 1.求出单个属性的频繁度,过滤低于最小频繁度的项 2.求出两个项的频繁度,过滤低于最小频繁度的项 3.优化聚合,将两个项的数据分别选择第一项相同的值进行聚合,得到三项 阅读全文
posted @ 2018-04-10 17:47 Aemnprsu_wx 阅读(106) 评论(0) 推荐(0) 编辑