随笔分类 - 读书笔记
摘要:挖掘的复杂数据类型: 时间序列的相似性搜索、时间序列的回归和趋势分析 对于相似性搜索,通常需要先对时间序列进行数据或维度归约和变换。典型的归约技术有:1)离散傅里叶变换 2)离散小波变换 3)基于主成份分析的奇异值分解 序列分为三类:1)基于特征的分类 把序列转换成特征向量,然后使用传统的分类方法;
阅读全文
摘要:频繁模式是指频繁的出现在数据集中的模式(如项集、子序列或子结构) 规则兴趣度的两种度量:支持度(所发现规则的有用性)和置信度(所发现规则的确定性) 关联规则的挖掘分以下两步: 1)找出所有的频繁项集 2)由频繁项集产生强关联规则 第二步的开销远小于第一步,因此挖掘关联规则的总体性能由第一步决定 先验
阅读全文