摘要:
一、论文整体思路: 作者提出了一种基于前缀树的数据结构,NegNodeset,其实是对之前前缀树的一种改进,主要区别在于采用了位图编码,通过这种数据结构产生的算法称为negFIN。 negFIN算法高效有三个原因 二、问题定义 I= {i1,i2,…, init} 表示事务数据库所有项的集合,T表示 阅读全文
摘要:
一、论文目标:将差分隐私和频繁项集挖掘结合,主要针对大规模数据。 二、论文的整体思路: 1)预处理阶段: 对于大的数据集,进行采样得到采样数据集并计算频繁项集,估计样本数据集最大长度限制,然后再缩小源数据集;(根据最小的support值,频繁项集之外的项集从源数据集移除) 我们利用字符串匹配去剪切数 阅读全文