会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
月圆天心
一切有为法,如梦幻泡影,如露亦如电,应作如是观。
首页
新随笔
联系
管理
2018年2月12日
word2vec原理
摘要: 一、统计语言模型统计语言模型就是指计算一个句子出现概率的模型。假设一句话由T个词按顺序构成,则这T个词的联合概率就是这个句子的概率:$$p(W)=p(w_1^T)=p(w_1,w_2,\ldots,w_T)$$利用贝叶斯公式,上式可写为:$$p(W)=p(w_1^T)=p(w_1)p(w_2|w_1
阅读全文
posted @ 2018-02-12 16:06 月圆天心
阅读(418)
评论(0)
推荐(0)
2017年9月3日
svd分解的深入理解
摘要: svd指的是奇异值分解,也就是对奇异矩阵的分解,对于可逆矩阵,可以进行特征值分解。 要想理解svd,需要先理解四个基本子空间,即行空间,列空间,零空间,左零空间。对于矩阵A,其行空间是由行向量线性组合而成的空间,也即由行向量张成的空间,同样的,列空间是由矩阵的列向量线性组合生成的空间。而零空间是Ax
阅读全文
posted @ 2017-09-03 23:02 月圆天心
阅读(4740)
评论(0)
推荐(0)
2017年1月13日
漫步支持向量机(svm)之二 拉格朗日乘子法
摘要: 所谓工欲善其事,必先利其器,要想求解目标函数的最小值,而且还是在有不等式约束条件下的最小值,就必须要知道拉格朗日乘子法。 设目标函数为$$J(x,y)=x^2+y^2$$ 则求$J(x,y)$的最小值很简单吧,让J关于x,y的偏导数等于0,即可求出最小点$\hat x,\hat y$,$J(x,y)
阅读全文
posted @ 2017-01-13 09:55 月圆天心
阅读(907)
评论(0)
推荐(0)
2017年1月9日
漫步支持向量机(svm)之一
摘要: 设输入为$x$,表示训练集的特征向量,输出为$y=\{1,-1\}$,这些向量都属于两类中的其中一类,假设这些向量是线性可分的,现在要找一个最优的平面(在二维的时候为一条直线),将这些特征向量正确分类,除此之外,能够将新的输入分到合适的类。 设中间直线方程为$$\hat \omega x+\hat
阅读全文
posted @ 2017-01-09 21:21 月圆天心
阅读(292)
评论(0)
推荐(0)
2016年8月1日
Coppersmith-Winograd 算法
摘要: 转自:https://www.douban.com/group/topic/29658298/ 对正整数 $q$,定义张量 $T$,其对应的多项式为 $p(X,Y,Z)=\sum_{i=1}^q (X_0Y_iZ_i+X_iY_0Z_i+X_iY_iZ_0)$。对于 $\epsilon>0$,定义张
阅读全文
posted @ 2016-08-01 20:28 月圆天心
阅读(5205)
评论(0)
推荐(1)
2016年7月20日
阿基米德项目ALS矩阵分解算法应用案例
摘要: 转自:https://github.com/ceys/jdml/wiki/ALS 阿基米德项目ALS矩阵分解算法应用案例 编写人:ceys/youyis 最后更新时间:2014.5.12 一、算法描述 1.原理 问题描述 ALS的矩阵分解算法常应用于推荐系统中,将用户(user)对商品(item)的
阅读全文
posted @ 2016-07-20 17:51 月圆天心
阅读(1740)
评论(0)
推荐(0)
2016年6月30日
ALS数学点滴
摘要: 其中,$n_{u_i}$表示用户$i$评分的电影数目,$n_{m_j}$表示对电影$j$评分的用户数目。设$I_i$表示用户$i$所评分的电影集合,则$n_{u_i}$是$I_i$的基数,同样的,$I_j$表示对电影$j$评分的用户集合,$n_{m_j}$是$I_j$的基数。这对应于Tikhonov
阅读全文
posted @ 2016-06-30 13:48 月圆天心
阅读(579)
评论(3)
推荐(0)
2016年5月18日
CDH5 安装过程
摘要: 一、环境 1.1 操作系统 1.2 Java环境 1.3 集群环境 二、配置网络以及数据库 2.1 配置网络 2.1.1 /etc/hosts 配置如下: 10.171.95.1 master 10.171.95.2 slave 注意:此处的机器名称不能带有下划线,否则会导致后面cloudera-s
阅读全文
posted @ 2016-05-18 18:11 月圆天心
阅读(1384)
评论(0)
推荐(0)
2016年3月15日
协同过滤中相似度的计算方式
摘要: 协同过滤中相似度的计算很有技巧性,下面对比几种计算的方式。 假设输入的Item-User矩阵为: 设用户共有M个,Item共有N个,在本例子中,$M=3,N=4$。矩阵中为空的元素代表对应的用户对Item没有行为,也可以认为该用户对该Item的评分为0. 一、用二维数组依次计算 这种方式的实现步骤如
阅读全文
posted @ 2016-03-15 14:34 月圆天心
阅读(3672)
评论(0)
推荐(0)
2016年3月12日
协同过滤对候选集的处理
摘要: 生成候选集 生成候选集的时候,是根据用户的历史喜好item进行的。假设用户以前喜欢的 item 为:$i_m, m=1\ldots M$。 如果用户过去喜欢的 item 比较多,需要设定一个 liked_topN 值,表示最多就取这么多item,也即$M \le liked\_topN$,当然这些i
阅读全文
posted @ 2016-03-12 13:03 月圆天心
阅读(812)
评论(1)
推荐(0)
下一页