月圆天心

2018年2月12日

摘要：一、统计语言模型统计语言模型就是指计算一个句子出现概率的模型。假设一句话由T个词按顺序构成，则这T个词的联合概率就是这个句子的概率：$$p(W)=p(w_1^T)=p(w_1,w_2,\ldots,w_T)$$利用贝叶斯公式，上式可写为：$$p(W)=p(w_1^T)=p(w_1)p(w_2|w_1 阅读全文

posted @ 2018-02-12 16:06 月圆天心阅读(423) 评论(0) 推荐(0)

2017年9月3日

svd分解的深入理解

摘要： svd指的是奇异值分解，也就是对奇异矩阵的分解，对于可逆矩阵，可以进行特征值分解。要想理解svd，需要先理解四个基本子空间，即行空间，列空间，零空间，左零空间。对于矩阵A，其行空间是由行向量线性组合而成的空间，也即由行向量张成的空间，同样的，列空间是由矩阵的列向量线性组合生成的空间。而零空间是Ax 阅读全文

posted @ 2017-09-03 23:02 月圆天心阅读(4867) 评论(0) 推荐(0)

2017年1月13日

漫步支持向量机(svm)之二拉格朗日乘子法

摘要：所谓工欲善其事，必先利其器，要想求解目标函数的最小值，而且还是在有不等式约束条件下的最小值，就必须要知道拉格朗日乘子法。设目标函数为$$J(x,y)=x^2+y^2$$ 则求$J(x,y)$的最小值很简单吧，让J关于x，y的偏导数等于0，即可求出最小点$\hat x,\hat y$,$J(x,y) 阅读全文

posted @ 2017-01-13 09:55 月圆天心阅读(919) 评论(0) 推荐(0)

2017年1月9日

漫步支持向量机(svm)之一

摘要：设输入为$x$，表示训练集的特征向量，输出为$y=\{1,-1\}$，这些向量都属于两类中的其中一类，假设这些向量是线性可分的，现在要找一个最优的平面（在二维的时候为一条直线），将这些特征向量正确分类，除此之外，能够将新的输入分到合适的类。设中间直线方程为$$\hat \omega x+\hat 阅读全文

posted @ 2017-01-09 21:21 月圆天心阅读(303) 评论(0) 推荐(0)

2016年8月1日

Coppersmith-Winograd 算法

摘要：转自：https://www.douban.com/group/topic/29658298/ 对正整数 $q$，定义张量 $T$，其对应的多项式为 $p(X,Y,Z)=\sum_{i=1}^q (X_0Y_iZ_i+X_iY_0Z_i+X_iY_iZ_0)$。对于 $\epsilon>0$，定义张阅读全文

posted @ 2016-08-01 20:28 月圆天心阅读(5357) 评论(0) 推荐(1)

2016年7月20日

阿基米德项目ALS矩阵分解算法应用案例

摘要：转自：https://github.com/ceys/jdml/wiki/ALS 阿基米德项目ALS矩阵分解算法应用案例编写人：ceys/youyis 最后更新时间：2014.5.12 一、算法描述 1.原理问题描述 ALS的矩阵分解算法常应用于推荐系统中，将用户(user)对商品(item)的阅读全文

posted @ 2016-07-20 17:51 月圆天心阅读(1760) 评论(0) 推荐(0)

2016年6月30日

ALS数学点滴

摘要：其中，$n_{u_i}$表示用户$i$评分的电影数目，$n_{m_j}$表示对电影$j$评分的用户数目。设$I_i$表示用户$i$所评分的电影集合，则$n_{u_i}$是$I_i$的基数，同样的，$I_j$表示对电影$j$评分的用户集合，$n_{m_j}$是$I_j$的基数。这对应于Tikhonov 阅读全文

posted @ 2016-06-30 13:48 月圆天心阅读(586) 评论(3) 推荐(0)

2016年5月18日

CDH5 安装过程

摘要：一、环境 1.1 操作系统 1.2 Java环境 1.3 集群环境二、配置网络以及数据库 2.1 配置网络 2.1.1 /etc/hosts 配置如下： 10.171.95.1 master 10.171.95.2 slave 注意：此处的机器名称不能带有下划线，否则会导致后面cloudera-s 阅读全文

posted @ 2016-05-18 18:11 月圆天心阅读(1392) 评论(0) 推荐(0)

2016年3月15日

协同过滤中相似度的计算方式

摘要：协同过滤中相似度的计算很有技巧性，下面对比几种计算的方式。假设输入的Item-User矩阵为：设用户共有M个，Item共有N个，在本例子中，$M=3,N=4$。矩阵中为空的元素代表对应的用户对Item没有行为，也可以认为该用户对该Item的评分为0. 一、用二维数组依次计算这种方式的实现步骤如阅读全文

posted @ 2016-03-15 14:34 月圆天心阅读(3696) 评论(0) 推荐(0)

2016年3月12日

协同过滤对候选集的处理

摘要：生成候选集生成候选集的时候，是根据用户的历史喜好item进行的。假设用户以前喜欢的 item 为：$i_m, m=1\ldots M$。如果用户过去喜欢的 item 比较多，需要设定一个 liked_topN 值，表示最多就取这么多item，也即$M \le liked\_topN$，当然这些i 阅读全文

posted @ 2016-03-12 13:03 月圆天心阅读(826) 评论(1) 推荐(0)

一切有为法，如梦幻泡影，如露亦如电，应作如是观。