摘要: 余弦相似度计算 余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。 我们知道,对于两个向量,如果他们之间的夹角越小,那么我们认为这两个向量是越相似的。余弦相似性就是利用了这个理论思想。它通过计算两 阅读全文
posted @ 2018-03-21 20:53 iSuperGifted 阅读(52252) 评论(2) 推荐(10) 编辑
摘要: 无论什么推荐算法,计算相似度都是避不开的,下面就总结一下已经了解的相似度计算方法。 1.余弦相似度 这个算是最常用的了,典型例子是计算文本相似度。通过计算两个向量间的夹角,越是相似夹角度数越接近0,所计算的值也就越接近1。 但是余弦相似度只对方向敏感,对距离并不敏感。 2.欧式距离(欧几里得距离) 阅读全文
posted @ 2018-03-21 20:50 iSuperGifted 阅读(2631) 评论(0) 推荐(0) 编辑
摘要: 智能推荐算法总的来说分为两种:基于内容的推荐算法和协同过滤推荐算法。 基于内容的推荐算法: 根据内容的相似度(静态的东西)进行推荐,内容不好提取的可以采取贴标签的形式来区分计算内容的相似程度。然后根据用户的喜好设置,关注等进行相似内容推荐。 协同过滤推荐算法: 根据动态信息来进行推荐,即推荐的过程是 阅读全文
posted @ 2018-03-21 20:41 iSuperGifted 阅读(9271) 评论(0) 推荐(0) 编辑
摘要: 一: 连接 多表的字段中含null的 多表查询 左右连接查询! 例: 一张 emp(emano,ename,sal,deptno) 雇员表, 一张 dept(deptno,dname) 部门表, 雇员 中 有 字段 为 部门 编号,而 部门表 只有 部门编号,与部门名称。 但 雇员表中 有一些 雇员 阅读全文
posted @ 2017-03-20 09:10 iSuperGifted 阅读(278) 评论(0) 推荐(0) 编辑