摘要:
降维 (dimensionality reduction)就是减少数据特征的维度 作用 使得数据集更易使用 降低很多算法的计算开销 去除噪声 使得结果易懂 PCA(主成分分析 Principal Component Analysis) PCA 将数据从原来的坐标系转换到了新的坐标系 第一个新坐标轴选 阅读全文
摘要:
FP growth(Frequent Pattern Growth)算法用于发现频繁项集 作用:比 Apriori 更高效的发现频繁项集 特点:快于 Apriori、实现比较困难 Apriori 每次增加频繁项集的大小,都会重新扫描整个数据集 当数据集很大时,这会显著降低频繁项集发现的速度 FP g 阅读全文