2020 年 3月 14 日随笔档案 - moon~light

2020年3月14日

摘要：基于协同过滤（collaborative filtering）的推荐引擎，是通过将用户和其他用户的数据进行对比来实现推荐不是利用属性来描述物品从而计算它们之间的相似度，而是利用用户对它们的意见来计算相似度，这就是协同过滤中所使用的方法，它并不关心物品的描述属性，而是严格地按照许多用户的观点来计算相阅读全文

posted @ 2020-03-14 22:03 moon~light 阅读(255) 评论(0) 推荐(0) 编辑

机器学习：降维工具 - SVD

摘要： SVD（Singular Value Decomposition，奇异值分解）是一种强大的降维工具很多情况下，数据的一小段携带了大部分信息，其他要么是噪声，要么就是毫不相关的信息，SVD 是矩阵分解的一种，可以把 SVD 看成是从噪声数据中抽取相关特征优点：简化数据，去除噪声，提高算法的结果缺阅读全文

posted @ 2020-03-14 20:56 moon~light 阅读(304) 评论(0) 推荐(0) 编辑

机器学习：降维工具 - PCA

摘要：降维（dimensionality reduction）就是减少数据特征的维度作用使得数据集更易使用降低很多算法的计算开销去除噪声使得结果易懂 PCA（主成分分析 Principal Component Analysis） PCA 将数据从原来的坐标系转换到了新的坐标系第一个新坐标轴选阅读全文

posted @ 2020-03-14 18:40 moon~light 阅读(385) 评论(0) 推荐(0) 编辑

机器学习：FP-growth

摘要： FP growth（Frequent Pattern Growth）算法用于发现频繁项集作用：比 Apriori 更高效的发现频繁项集特点：快于 Apriori、实现比较困难 Apriori 每次增加频繁项集的大小，都会重新扫描整个数据集当数据集很大时，这会显著降低频繁项集发现的速度 FP g 阅读全文

posted @ 2020-03-14 15:34 moon~light 阅读(391) 评论(0) 推荐(0) 编辑

moon__light

公告