qkloveslife

2018年11月5日

摘要：推荐系统——电影评分例子：预测电影评分有如下信息定义 nu = 用户的数量 nm = 电影的数量 r(i, j) = 1 如果用户 j 给电影 i 打分 y(i, j) = 当 r(i, j) = 1 的情况下，用户 j 给电影 i 打的分数（0-5）目标：预测？的值（未评分用户对电影的评阅读全文

posted @ 2018-11-05 12:05 qkloveslife 阅读(342) 评论(0) 推荐(0)

2018年11月4日

异常检测

摘要：假设你有一些数据如下图这时，给一个新的数据，我们认为这个数据和原来的数据差距不大，因此认为这个数据时正常的对于下图所示的新数据，我们认为它是“异常点”，因为它距离其他数据较远一般情况下异常检测的训练数据集都是正常/都是不正常的数据然后判断测试数据是否是异常数据异常检测方法：根据无标签的阅读全文

posted @ 2018-11-04 20:49 qkloveslife 阅读(1508) 评论(0) 推荐(0)

降维——PCA主成分分析

摘要：运用二维降维到一维的例子帮助理解对于如下二维数据 PCA算法会试图寻找一条直线使得所有数据到这个直线的距离的平方和最小（”投影误差“最小）（图中所有蓝色线长度的平方和）（注意：做PCA之前需要将数据进行标准化，将数据映射到（0，1）区间内）对于以下两种情况，PCA会选择红色线更书面的表达 Re 阅读全文

posted @ 2018-11-04 12:51 qkloveslife 阅读(620) 评论(0) 推荐(0)

无监督学习——降维

摘要：为什么要降维？维数少可以使算法有更快的计算速度，减少机器内存占用等多个特征携带的“信息”有相同或类似的情况（冗余）用于数据可视化如何降维？简单的例子，对于二位数据可以找到一条线将所有的数据映射到这条线上然后用映射后的一维数据去代表二位数据三维降维到二维的例子，假设数据如下这时，表阅读全文

posted @ 2018-11-04 11:08 qkloveslife 阅读(1525) 评论(0) 推荐(0)

2018年11月3日

无监督学习——K-means聚类

摘要：先用图来描述K-means怎么做的对于如下数据如果你想分成2类（k=2），算法会随机生成两个聚类中心然后会分别计算每个数据（绿点）与聚类中心的距离（一般是欧式距离），来决定属于哪个类（距离哪个聚类中心近）这样，就得到了数据的第一次分类，接下来算法会计算已分类的数据的“中心”，将它们作为新的聚阅读全文

posted @ 2018-11-03 19:51 qkloveslife 阅读(680) 评论(0) 推荐(0)

支持向量机——内核

摘要：对于非线性“Decision Boundary” 如果用传统的多项式回归，有 \[{h_\theta }\left( x \right) = {\theta _0} + {\theta _1}{x_1} + {\theta _2}{x_2} + {\theta _3}{x_1}{x_2} + {\t 阅读全文

posted @ 2018-11-03 11:56 qkloveslife 阅读(1093) 评论(0) 推荐(0)

2018年11月2日

支持向量机背后的数学

摘要：向量的内积（inner product）对于向量 \[\begin{array}{l}u = \left[ {\begin{array}{*{20}{c}}{{u_1}}\\{{u_2}}\end{array}} \right]\\v = \left[ {\begin{array}{*{20}{c 阅读全文

posted @ 2018-11-02 20:52 qkloveslife 阅读(382) 评论(0) 推荐(0)

支持向量机——Large Margin Classifier

摘要：支持向量机的目标是 \[\underbrace {\min }_\theta \left\{ {C\left[ {\sum\limits_{i = 1}^m {{y^{\left( i \right)}}{\mathop{\rm Cos}\nolimits} {t_1}\left( {{\theta 阅读全文

posted @ 2018-11-02 19:25 qkloveslife 阅读(585) 评论(0) 推荐(0)

2018年11月1日

支持向量机

摘要：逻辑回归的另一种观点 \[{h_\theta }\left( x \right) = \frac{1}{{1 + {e^{ - {\theta ^T}x}}}}\] 如果y=1，我们希望hθ(x)≈1，对应θTx >> 0 如果y=0，我们希望hθ(x)≈0，对应θTx << 0 对于一个样本（x, 阅读全文

posted @ 2018-11-01 19:15 qkloveslife 阅读(243) 评论(0) 推荐(0)

机器学习与数据

摘要： 2001年Bank和Bill做了这么一个实验区分容易混淆的词，如（to, two, too）比如：For breakfast I ate two eggs. 他们用了不同的算法： Perceptron (Logistic regression) Winnow Memory-based Naïve 阅读全文

posted @ 2018-11-01 11:38 qkloveslife 阅读(203) 评论(0) 推荐(0)

公告