摘要:
一、统计语言模型统计语言模型就是指计算一个句子出现概率的模型。假设一句话由T个词按顺序构成,则这T个词的联合概率就是这个句子的概率:$$p(W)=p(w_1^T)=p(w_1,w_2,\ldots,w_T)$$利用贝叶斯公式,上式可写为:$$p(W)=p(w_1^T)=p(w_1)p(w_2|w_1 阅读全文
摘要:
svd指的是奇异值分解,也就是对奇异矩阵的分解,对于可逆矩阵,可以进行特征值分解。 要想理解svd,需要先理解四个基本子空间,即行空间,列空间,零空间,左零空间。对于矩阵A,其行空间是由行向量线性组合而成的空间,也即由行向量张成的空间,同样的,列空间是由矩阵的列向量线性组合生成的空间。而零空间是Ax 阅读全文
摘要:
所谓工欲善其事,必先利其器,要想求解目标函数的最小值,而且还是在有不等式约束条件下的最小值,就必须要知道拉格朗日乘子法。 设目标函数为$$J(x,y)=x^2+y^2$$ 则求$J(x,y)$的最小值很简单吧,让J关于x,y的偏导数等于0,即可求出最小点$\hat x,\hat y$,$J(x,y) 阅读全文
摘要:
设输入为$x$,表示训练集的特征向量,输出为$y=\{1,-1\}$,这些向量都属于两类中的其中一类,假设这些向量是线性可分的,现在要找一个最优的平面(在二维的时候为一条直线),将这些特征向量正确分类,除此之外,能够将新的输入分到合适的类。 设中间直线方程为$$\hat \omega x+\hat 阅读全文
摘要:
转自:https://www.douban.com/group/topic/29658298/ 对正整数 $q$,定义张量 $T$,其对应的多项式为 $p(X,Y,Z)=\sum_{i=1}^q (X_0Y_iZ_i+X_iY_0Z_i+X_iY_iZ_0)$。对于 $\epsilon>0$,定义张 阅读全文
摘要:
转自:https://github.com/ceys/jdml/wiki/ALS 阿基米德项目ALS矩阵分解算法应用案例 编写人:ceys/youyis 最后更新时间:2014.5.12 一、算法描述 1.原理 问题描述 ALS的矩阵分解算法常应用于推荐系统中,将用户(user)对商品(item)的 阅读全文
摘要:
其中,$n_{u_i}$表示用户$i$评分的电影数目,$n_{m_j}$表示对电影$j$评分的用户数目。设$I_i$表示用户$i$所评分的电影集合,则$n_{u_i}$是$I_i$的基数,同样的,$I_j$表示对电影$j$评分的用户集合,$n_{m_j}$是$I_j$的基数。这对应于Tikhonov 阅读全文
摘要:
一、环境 1.1 操作系统 1.2 Java环境 1.3 集群环境 二、配置网络以及数据库 2.1 配置网络 2.1.1 /etc/hosts 配置如下: 10.171.95.1 master 10.171.95.2 slave 注意:此处的机器名称不能带有下划线,否则会导致后面cloudera-s 阅读全文
摘要:
协同过滤中相似度的计算很有技巧性,下面对比几种计算的方式。 假设输入的Item-User矩阵为: 设用户共有M个,Item共有N个,在本例子中,$M=3,N=4$。矩阵中为空的元素代表对应的用户对Item没有行为,也可以认为该用户对该Item的评分为0. 一、用二维数组依次计算 这种方式的实现步骤如 阅读全文
摘要:
生成候选集 生成候选集的时候,是根据用户的历史喜好item进行的。假设用户以前喜欢的 item 为:$i_m, m=1\ldots M$。 如果用户过去喜欢的 item 比较多,需要设定一个 liked_topN 值,表示最多就取这么多item,也即$M \le liked\_topN$,当然这些i 阅读全文